Googleは世界で最も有名な検索エンジン。
私個人的には、日本語でのSEO(検索エンジン向け最適化)は難しいと思っています。
過去数年、SEOの仕事をしてきて、いっさい同僚に共感を得なかった、SEOにまつわる言語のお話。
書いてること
そもそも、Googleさんって外人だよね
日本語での検索アルゴリズムについて何度も話題になってますが、結局はGoogleさんは日本語を理解できないんじゃないか、というのが一つ目の話題。
っというのも、どんなに日本語向けのアルゴリズムアップデートを行っても、中身(Googleさんの脳みそ)は英語向けに作られているという推測から。
一時期、日本語スラッグがいい、だとか、日本語ドメインが有効だ、とか言われる時期がありましたが、あれは検索アルゴリズムでのRatingには一切寄与していないんじゃないか、と思っています。
そのあたり、自分なりの考察をまとめていきます。
まずは、Googleさんの母国語・英語と我々がネイティブである日本語の違い、そしてそれがSEOにどれだけ違うのか、今まで考察したことをまとめたいと思います。
英語と日本語は全く違う言葉
中学・高校と並みの教育を受けた方は、日本語と英語がどれだけ違うかは、ご存じと思います。
大きなところを上げれば(個人的な意見ですが)以下の通り
- 言葉が違う(単純だけどこれは大きな違い)
- 文節の区別が明確
- 語順が違う
- 省略の可否などが違う
などなど。
ちょっとSEOに影響のありそうな違いを中心に上げたので偏っているかもしれません。もし語学的にももっと違いをご存じの方がいらっしゃったら、ぜひお聞かせください。
(コメント待ってます)
上に挙げたポイント「そんなの分かってる!」というモノばかりだと思いますが、これがSEOになると相当なクセモノです。
言葉の違い
英語の記述にはアルファベットが使われます。
アルファベットは「表音文字」と呼ばれるもので、文字ひとつが一つの音に相当します。
実はひらがなも表音文字と言われるのですが、日本語と英語では各段に違うものがあります。
それは、同じ文字数で表現できる情報量。これは長文になるほど顕著に現れます。
cat
猫
ねこ
This is a pen.
これは、ぺんです。
Can’t hold it back anymore
これ以上、抑えることはできない。
これいじょう、おさえることはできない。
単語で比べると(しかも漢字を含むと)その差は伝わりにくいと思いますが、英語の方が少ない音(つまり文字数)で表せられるように出来ています。
同じ情報を伝えるのであれば、英語の方が6割程度の文字で伝えることができます。
海外SEO情報で「1,000文字以上のコンテンツが必要」とか「500ワード以上を推奨」とかいう記事を見かけますが、あれは英語で、アルファベットで、って話ですからね。
文字数で比較すると、情報伝達効率の悪い日本語が、アルゴリズムの中まで使われているかどうか怪しい、と私が考えるのは、この辺りの違いがあると考えているからです。
もしかしたらGoogleさんの検索脳では
日本語の検索キーワード
↓
検索キーワードを英語翻訳
↓
英語に翻訳された日本語エンティティにHit
↓
日本語のコンテンツを検索結果として表示
みたいな回りくどいことしてるんじゃ?って勘ぐってた時期もありました。
さすがにそれはないとは思いますけど。。
文節の区切りが明確
日本語がSEOに不利な理由はもう一つあります。
英語では、単語の区切りはスペースによって分かれていて、明確に単語の区切りを判別することができます。
一方、日本語では句読点がない状態では、単語の区切りが明確ではありません(機械にとっては)。
日本語を単語に分けるには、形態素解析のような手法によって単語に分ける必要があります。
(Googleさんがこの手法を使っているかどうかは分かりませんが、似たようなことはやっていると思われ)
さらには、日本語では単語のうち、助詞・助動詞などのあまり意味をなさない言葉(自立語に対する、付属語)は無視して(無視ではなくとも、軽視して)取り扱われてると考えられます。
キュレーションサイトがクラウドワーカーのフリーライターに発注すると、これら付属語や言い回しで文字のかさましをされちゃったりするんですね。
↑この表現もかさまし(笑)
それだけ、日本語は機械にとっては難解で、意味の薄い言葉になっていると言えます。
直接的に不利、というわけではないですが、英語のコンテンツに比べると、より文字数や語彙力がないと、同等の評価は受けられないと考えることができます。
(そもそも、検索されるキーワードで明確に分けられるので、英語vs日本語の議論は意味がないのですが)
この辺りを考えると、日本語スラッグ(URLエンコードされた文字列)が優遇されるというSEOネタはとても眉唾物に感じられてきます。。
語順が違う
日本語でSEOをやっていて、海外SEO情報を参考にすると、とても悩んでしまうことがあります。
それは
「Googleは、文頭にある言葉を優遇するぞ!」
というSEOネタ。
なぜこのような話になるかというと、英文法では、主語(今から記述する言葉の主役)が文頭に来る、と決まっているから。
それに比べ、日本語は主語が文頭に来るとは限りません。
いえ、記述が高度に、情報が複雑になるにつれて、主語が文頭にくる可能性はほとんどなくなる、といっても過言ではないかもしれません。
例えば以下の文章。
今年10歳になる私の息子は、ゲームが好きだ。
My son, 10 years old this year, likes video games.
日本語と英語で同じ意味の文章を作ってみました(英語はGoogle先生に聞きました)。
文頭にある言葉を重視するのであれば、上記の日本語では「今年」「10歳」が強い意味を持つことになってしまいます。
でも、この文章の主語は「(私の)息子」ですよね。
元々外人さんであるGoogleさんが、「今年10歳になる」を修飾語とみなし、「私の息子」を強調してくれるのかどうか。。
私には到底、そこまでの能力には至ってないのでは、と思います。
Googleさんが、文頭の単語を重要視しているのは、英語の成り立ちからして間違いないと思います。
では、日本語版での検索では
「その機能はOffってるのか」それとも
「その機能を弱めてるのか」もしくは
「実は有効なのか」
この辺りはとても興味深い謎だと思います。
まぁ、やらないんですけどね。
主語を文頭に無理やり持ってくると、とても不自然な文章になってしまうので。
省略の可否などが違う
最後に、最大の問題点です。
これは主語の話とも似たような話ではあるのですが。。。
日本語では、主語の省略をしても、意味が通る文章になってしまいます。
いや、違いますね。
日本語では、自然な文章を書く場合、主語を省略して書くことが多い?
ん?なんか不自然ですね。
要するに、日本語で自然なコンテンツを制作しようとすると、主語が予想以上に出てこなくなります。
主語は、SEOを目的としたコンテンツでは「ターゲットキーワード」となることが多いです。
そのページで、主語を省略してよい(適度に省略したほうが自然な)日本語で記述すると、ターゲットキーワードの出現頻度が大幅に下がってしまいます。
とあるセミナーに参加したときは、ターゲットキーワードの出現頻度は4%前後だとのことでした。
これ、私も過去に厳密に計算してやったことがあるのですが、全然そんなに出現しません。
下手すると、8,000字を超えるテキストコンテンツに、1、2回しか出てこない、なんてこともザラでした。
日本語は「行間を読む」みたいな表現をすることがありますが、Googleさんが行間を読んでくれることは、さすがにないとおもいます。。
本職ではなくなってしまったため、結局これらの問題は解決しじまい(検証、結論まで行きつかなかった)のですが、サイトコンテンツを制作するときには、いつもこれらの問題いまだに気を取られてしまいます。。
(今はSEOではなくクリエイター?側にジョブチェンしたので、そこまでする必要がないのですが。。)
では、日本語でSEOはどうやっていくべき?
繰り返しになりますが、この問題は私の中では未解決事件です。
なので、未検証な考察も含め、また私が実施したかった(けど実施にまで至らなかった)、SEOアイデアをまとめていきたいと思います。
スラッグは基本、英語で。
Googleさんは外人なので、きっと英語の方が、意味をくみ取りやすいのだと思います。
Googleさんは検索キーワードやコンテンツ内の単語を「エンティティ」という形で認識しているそうです。
検索アルゴリズムがベースで各国で共通であるとして、一つの事象を指し示すエンティティは、各言語で共通の一つのデータであると予測します。
例えば、「犬」というワードのエンティティがあるとして
犬=Dog=狗
各国でいろんな犬の呼び名があるとしても、犬という概念は一つなので、Googleさんの中の取り扱いも(言語は何であっても)同じものとして認識するだろう、と考えます。
それならば、日本語で「犬」を強調するよりも、スラッグを英語にすることでよりGoogleさんに「犬のことが書いてるよ」と伝えやすくなるのではと考えるわけです。
主語を一つ一つ丁寧に。
文頭に出てくる言葉が強い意味を持つのは、実は英語だけではありません。
日本語にも倒置法という表現で、文頭に強調したい言葉を持ってくる技法があります。
(この場合、主語が文末に体言止めで使われることもあるので、日本語に配慮されているなら文末のキーワードも重要になってくるはずですが。)
一方では、実はGoogleさんの解析能力は結局そんなに高度じゃない、というオチも考えられます。
この仮定が通ってしまう場合、やはり普通の日本語の表現ではターゲットキーワードの出現頻度が足りない、ということになってしまいます。
そこで、SEOを意識した文章では、意識して主語(そのページでの重要な言葉)を丁寧に記述するようにすることで、対策になると考えます。
構造化データを使用する。
Googleが推奨する、コンテンツ内に機械向けの情報をマークアップするのが、構造化データです。
これは日本語圏だけのものではなく、本国(英語圏)からスタートしたものだと考えると、Googleさんは英語でもコンテンツ解析や検索アルゴリズムにはなかなか苦労してるんだな、ということがうかがえます。
前述の英語スラッグと考え方は同じですが、構造化データではそれを明示的に表現することができます。
構造化データは、検索順位に直接的に影響しない、というのが定説ですが、それは英語圏での話。
日本語は、Googleさんにとって解析しづらい言語であるとすれば、構造化データを使用することは非常にSEO的に有利な施策であると考えられます。
なお、日本語だけでマークアップしては不十分で、各データでは“sameAs”などで英語名、英語版URL、英語版WikipediaのURLなどを丁寧に掲示することで、Googleさんの解析はおどろくほどはかどるのだろうと推測します。
コンテンツの長さよりも、話題数で勝負
日本語が、英語に比べ冗長で、情報量の薄い存在であることは先に触れました。
このことを考えると、コンテンツをただ長くすることは、直接的には「情報の豊富さ」にはとらえられないのだと思います。
注意すべきは、コンテンツ内に含まれる「話題」の数。
話題とは、英語では「Topics」と解説されることがありますが、何も「文字通りの話題には限らないのでは」と考えています。
もっと端的に表現してしまうと、
コンテンツに内包される単語の種類。
単語はGoogleさんにとっては「エンティティ」として解析されます。
より多くのエンティティが含まれるコンテンツは情報量が豊富であると認識され、専門性も高まるのではないでしょうか。
なお、一つ一つのエンティティは、そのページの主題に関連することは必要条件ですし、ページ内で重要なエンティティであることを表現するには、それなりの出現頻度が必要だと思われます。
つまりは、メインテーマに関連する話題を豊富に取りそろえ、一つ一つを丁寧に説明することが、重要になると思われます。
英語や略語、言い換えは柔軟に解説
Wikipediaの日本語ページを見てみると、英語、略語、言い換えなどを丁寧に表現しています。
これは、前述の「英語スラッグ」と同じ狙いですが、あらゆる表現を掲示しておくことで、Googleさんが理解する手助けができると考えられます。
日本語で、例えば「リスケ」と表現される言葉でも、
- Re-schedule
- 予定変更
- 先延ばし
など、様々な表現ができます。
Wikipediaパイセンのように定型的にするでも、文章の中にちりばめるでも、ひとつのエンティティについて様々な表現をした方が、Googleさんにとっては優しいコンテンツになり得ると思います。
では、日本語スラッグって何だったの?
最後に、適当に否定した日本語スラッグが、なぜ効果があると思われたのか(現実に効果があることもあるので、それはなぜか)を考察してみます。
なんだかんだで、CTRは大事
日本語スラッグの生きる場所は、ずばりSERPs(Search Engine Result Pages:検索結果ページ)において、だと考えています。
Googleさんが、SERPsでのCTR(Click Through Rate:クリック率)を重視することは、SEOの分野ではもはや常識です。
Googleさんや中の人たちがどんなにデータを解析しても、人間の感じる「あーこれこれ」にはまだ遠く及ばないのだと推測できます。
そこで、Googleさんが選んだのは
「どのコンテンツがより良いのか、人間に選んでもらおう」
という、苦肉の策。
人間にとってより良いコンテンツを表示してあげるのがGoogleさんの役目だったはずなのに、それを人間に任せてしまったのだと考えます。
ここで、冒頭の日本語スラッグが効いてきます。
Googleの検索結果では、URL(というより、パンくずのようなファイルパス)が表示され、日本語スラッグは「日本語として表示」されます。
これが、検索エンジン利用者に非常に目につきやすく、大幅にCTRに寄与するのだということは、容易に想像できます。
つまり、正攻法として「情報量の提示でGoogleさんの評価をうける」のではなく、「利用者の声でRatingをジャンプアップする裏技」となり得たのだと考えられます。
まとめ
GoogleでのSEOにおいて、言語の特性による違いを考察してみました。
なにぶん、SEOの効果は直接的には見えないもので、また、私の主観や妄想・空想に基づく推論も多分に含まれます。
実際にSEO施策を行っている方に置かれましては、話半分で受け取って頂けたらいいのかなと思います。。
このサイト「のこと考えた」も、個人的に自由な立ち位置から書いたコンテンツが検索エンジンでどのような反応を示すのか、見てみたかったことが動機の一つになっています。
このサイトのこの先長い(?)時系列の中で、ここで書いたアイデアが検証できればと思っています。