Google の検索結果における順位はどのように決まるか?
Google で何らかのキーワードを入力して検索すると、その検索ワードでヒットしたページが上から順番に表示されます。より上位に表示されるホームページにはより多くの人が訪れるため、自分がターゲットにしている検索ワードの検索結果において上位に表示されるよう、自分のホームページを最適化する必要があります。
では、検索結果における表示順位はどのように決まるのでしょうか。Google は世界中のホームページに対して「クロール(crawl)」「インデックス(index)」「スコアリング(scoring)」という作業を繰り返し行うことで、検索順位を動的に決定しています。
クロールとは、Google のソフトウェアが世界中のホームページを巡回し、ホームページを評価する上で必要となる情報を収集するプロセスのことです。ここで収集する情報としては、ホームページを構成する個々のページの URL やページ間の階層構造、カテゴリ、タグ、コンテンツ(文章や画像など)など、様々なものがあります。
インデックスとは、収集した情報を Google のデータベースに登録するプロセスのことです。Google の検索結果に表示されるのは、Google のデータベースにインデックスされたページだけです。つまり、Google によってクロールされていないページやインデックスされていないページは、Google の検索結果に表示されません。
スコアリングとは、Google がインデックスしたページを、独自のアルゴリズムにもとづいて評価し、検索順位に反映させるプロセスのことです。つまり、ホームページが Google によってクロールされ、インデックスされても、スコアリングの過程で高く評価されない限り、そのホームページは Google の検索結果において上位には表示されません。
私たちユーザーができることとできないことの範囲
クロールとインデックスに関しては、私たちユーザーは多くのことができます。つまり、私たちは Google に対して、自分のホームページをクロールないしインデックスしてもらえるように要請できますし、ほとんどの場合、Google は要請通りに対応してくれます。ホームページの中の特定のページだけをインデックスしたり、逆に特定のページをインデックスしないようにすることもできます。
一方、スコアリングについては、私たちユーザーの思い通りにいくとは限りません。Google はホームページの評価アルゴリズムを公開していないからです。また、Google はこの評価アルゴリズムを改善・更新し続けています。ですから、私たちユーザーが試行錯誤を積み重ねながらホームページを現行のアルゴリズムに最適化しても、アルゴリズムが更新されれば順位が変動してしまうという事態はしばしば起こります。
ただ、どのようなホームページが高く評価される傾向があるかという大まかな方向性に関しては、Google は原理原則を持っており、それに関して積極的に情報発信を行っています。Google の使命は、「世界中の情報を体系化し、アクセス可能で有益なものにすること」であり、検索エンジンはこの目的を達成するための手段として生まれました。かつては評価アルゴリズムが未熟であったため、ユーザーは小手先の技術(無意味にリンクを増やす、コメントスパムでリンクを取得する、検索ワードを無意味に掲載する)を通じて、中身を伴わないホームページを検索結果の上位に表示することができました。しかし近年は、検索エンジンを支えるアルゴリズムが精緻化したため、これらの手法は通用しません。Google の当初の意図通り、検索エンジンがより正確に「有用なコンテンツ」を見つけることができるようになった現在、より重要な Google 対策は、有用なコンテンツをホームページに継続的に投稿し続けることになりつつあります。
インデックスとスコアリングの関係
インデックスとスコアリングの間にはどのような関係が成立するでしょうか。つまり、より多くのページが Google によってインデックスされているホームページは、より高く評価されるのでしょうか。
ホームページ中の個々のページがユーザーにとって有益な情報であるならば、より多くのページが Google によってインデックスされるほど、そのホームページは高く評価されます。一方、個々のページがユーザーにとって有益ではない場合には、より多くのページをインデックスさせたからといって、そのホームページの評価は上がるとは限りません。重要なのはインデックス数ではなく、インデックスされるページの質です。
さらには、ユーザーにとって有益ではないページをインデックスさせることにより、ホームページの評価が落ちてしまうこともあります。以下ではそのような事例を紹介します。
画像をインデックスさせることの是非
ワードプレスで作成したホームページに画像をアップロードすると、ワードプレスはその画像を保存するだけでなく、画像に対して attachment URL と呼ばれる URL を付与します。つまり、ワードプレスはそれぞれの画像を 1 つのページとして扱うということです。したがって、デフォルトの設定のままでは、Google がこのホームページをクロールすると、それぞれの画像をページとしてインデックスしてしまいます。
ホームページ中の各ページに張り付けた画像は、文字では伝えられないような情報をユーザーに伝えることができるため、非常に有益です。つまり、ページのコンテンツの一部として、個々の画像は有益です。しかし、画像単体にはそれほどの価値はありません。ですから、個々の画像が単独のページとしてインデックスされてしまうと、ユーザーにとって有益ではないページをインデックスしたことと同じ効果が発生し、ホームページの評価が落ちてしまうことがあります。
このような問題を回避するために、ワードプレスのユーザーは、画像がインデックスされないように対策を講じます。しかし、何らかの原因により、画像がインデックスされてしまうことがあります。
事例(画像のインデックス状況と検索順位の関係)
以下のグラフは、私たちが関わっているホームページのインデックス状況を表しています。
2019 年 10 月の中頃から後半にかけてインデックス数が急増していることを読み取れますが、それらのページの URL を調査したところ、いずれも画像の attachment URL であることが判明しました。それ以前から、画像がインデックスされないよう対策を講じていたのですが、このタイミングにおいて何らかの原因により、画像がインデックスされてしまったことになります。グラフの右端においてインデックス数が減少しているのは、不要な URL をインデックスしないように対策を講じたためです。不要な URL のすべてがインデックス解除されたわけではないですが、段階的に減少している様子を観察できます。
以下のグラフは、同時期における Google での検索順位を表しています。キーワードはビッグキーワードです。
それ以前は 1 位~ 3 位で順位が安定していたのですが、意図せざるインデックスが増加して以降、順位が下降。不要な URL のインデックス解除を行って以降、順位は回復し、現在も以前のように 3 位以上で安定している様子がグラフから観察できます。
これらの結果は、「画像がインデックスされるとホームページの評価が下がる」という仮説を否定しません。ただ、同時期において、Google のアルゴリズムが大幅にアップデートされたり(2019 年 10 月)、当ホームページを更新したり、もしくは、競合ホームページの内容が更新されるなど、変化した要因が数多く存在します。つまり、その他の条件をすべて一定とすることはできず、完全な対照実験にはなっていない点に留意する必要があります。