アルゴリズム
スコアリング(検索順位の決定)
スコアリングとは、検索エンジンの運営プロセスの中で、「照合」「判定」の役割を担う作業です。
スコアリングでは、ユーザーから要求されたキーワードに対して、インデックスされた個々のWebページと要求されたキーワードの適合度をスコアと呼ばれる数値のかたちで算出し、順位を決定します。
順位の決定には様々な要因が用いられます。スコアリングは、検索エンジンの検索精度を決める重要な作業であるため、各検索エンジンベンダーは様々な方法を複合的に用いています。
ランキングアルゴリズム
検索結果の順位を決めるアルゴリズムのことをランキングアルゴリズムといいます。
検索結果の順位は多数のアルゴリズムの組み合わせによって計算されており、また個々のアルゴリズムやその配分は日々チューニングされているため、アルゴリズムの全体像を知ることはできません。
主要な部分に限りますが、ここではそのランキングアルゴリズムについて説明します。
ページの重要度を測る指標
- リンクポピュラリティ
リンクポピュラリティ(参照重要度)とは、被リンクの質と量をもとにWebページの重要性を判断するアルゴリズムで、代表的なものに Google の PageRank があります。 - サイトテーマー
サイトテーマ(またはテーマテクノロジー)とは、共通したテーマ性を持つWebサイトやそれらのつながりに高い評価を与えるスコアリングアルゴリズムです。 - HITSアルゴリズム
HITSとは(Hypertext Induced Topic Selection)の略で、被参照度(オーソリティスコア)と、評価の高いWebページへの参照度(ハブスコア)から、重要性の高いWebページを抽出するアルゴリズムです。 - クリックポピュラリティ
クリック人気とは、検索結果に対するユーザーのクリック数を、検索順位の評価付けに使うスコアリングアルゴリズムです。
キーワードとページとの関連性を測る指標
- キーワードマッチング
検索エンジンは、要求された検索キーワードに対して、そのキーワードに一致するドキュメントのリストを検索結果に表示します。「検索キーワードに一致した文字列がHTML ファイル内に含まれていること」が、検索結果にリストされる条件であり、これを「テキストマッチ」といいます。テキストマッチは上位表示以前の基本要件です。検索キーワードに対して、このテキストマッチを最適化することを「キーワードマッチング」といいます。キーワードマッチングの最適化とは、キーワードとの一致性を最適化することで上位表示を狙う方法です。 - キーワード出現頻度
キーワード出現頻度とは、検索キーワードがどれだけ含まれるかの割合によって、キーワードとWebページの関連性を判断するものです。 - キーワード突出度
キーワード突出度とは、キーワードがどのような位置に記述されているのかによって、キーワードとWebページの関連性を判断するものです。 - キーワード近接度
キーワード近接度とは、検索キーワード同士が記述される距離によって、キーワードとWebページの関連性を判断するものです。 - キーワード配置
キーワード配置とは、キーワードがどんなHTML要素に含まれているかによって、つまりはキーワードをマークアップしているタグの種類によって、キーワードの重要性やページの関連性を判断するものです。
- title要素
HTMLドキュメントに含まれるすべての要素の中で、検索アルゴリズムは、このtitle要素の内容として記述された文字列に最も強い重み付けをします。title要素は文字通りそのドキュメントの表題を表し、そのドキュメントの内容を最も端的に表す文字列が入るべきところであり、適切なキーワードを含めることでSEOを効果的にします。 - アンカーテキスト
多くのページから同一のアンカーテキストでリンクを張られているページは、そのキーワードに対する評価が高いものとしてスコアリングすることができます。そのため、ターゲットとするキーワードでの多くの被リンクを集めることが、検索結果の向上につながります。 - h要素
ユニバーサルな情報共有を行うことを目的として設計されたHTMLは、文書の論理構造を伝えることに適した文法を持っています。中でも特徴的なのが、段階的な見出しレベルを示す<h1>〜<h6>タグです。 - インラインの強調要素
検索エンジンはキーワードがどのようなHTML要素内に記述されているかによって、キーワードがウェブページの中でどの程度の重要度をもって扱われているのかを判断します。ここでは強調のために使用されるインライン要素について説明します。 - meta要素
meta要素はhead要素の子要素として定義されており、任意の個数をhead要素の中に含めることができます。用途としては、テキストのマークアップとは別に「ページの情報(プロファイル)」を指定することに使用されます。検索エンジンに関連するところでは、キーワードの指定、ページ要約文の指定、使用している文字セットの指定、検索エンジンロボットの動作の指定、といったものが代表的なものになります。 - img要素とalt属性
img要素は画像を埋め込むインライン要素で、alt属性では代替テキストを指定します。検索エンジンのimg要素およびalt属性の扱いは一定しませんが、基本となる最適化方法について説明します。
- TF-IDF法
キーワードの重要性の違いに配慮することで複数語での検索時の精度を高めるTF-IDF法について説明します。
<< PAGE TOP >>





