忍者ブログ

[PR]

2017年10月23日
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

検索エンジンの仕組み(その1)

2009年09月04日

何かと戦う時は、敵を知らなければなりません。
検索エンジンは敵ではなくて味方であり、別に戦うわけではありませんが、一筋縄ではいかない存在です。

今回は、今後のSEO対策において「なぜその様なことが必要なのか」ということを理解するために、

検索エンジンの仕組みを詳しく書いてみようと思います。

前回もそうでしたが、ブログとしては長文すぎると思いますので(今回のお題も少し長くなる予定です)、適度に区切って進めていきたいと思います。

 

インターネットは電話回線を使用していますので、検索で何かを調べるときは、電話で問い合わせすることと似ています。

電話で「大橋さんを教えてください」と問い合わせをしますと、
「ええと、1番大橋さんぽい人は・・・」
「2番目に大橋さんぽい人は・・・」
という具合に、大橋さんをランクづけて教えてくれます。


yahoo、googleなどの検索エンジンは、その時に全国の大橋さんぽい人を調べるのではなく(そんなことをしたら1日あっても足りません)、あらかじめ情報として蓄えてあったものから選んで教えてくれます。

つまり、yahoo・googleなどの会社にあるパソコンにデータとして保存してあるもの(キャッシュ:cache:格納)のうち、索引がつけられたもの(インデックス:index)の中から、大橋さんのランクづけを行って順に教えてくれるわけです。
本でいいますと、キャッシュが本の中の各ページにある本文であり、インデックスが巻末の索引みたいな感じになります。


この保存方法は、クローラー(またはスパイダー。芋虫・蜘蛛ですが、どちらもリンクという枝・糸をたどって移動する感じです)という自動調査プログラムにより行われます。

保存したデータには索引がつけられますが、ここで、検索される様々な単語とHPのアドレスがセットとして扱われるようになります。検索結果にキャッシュも表示される場合はキャッシュのアドレスもセットになります。その他色々な情報がここにセットになります。

なお、あるサイトがどれだけインデックスされているかはyahoo・googleの通常の検索キーワードを入力する欄に「 site:調べたいサイトのURL 」を入力すると表示することができます。

yahooの場合は、サイトエクスプローラーで調べることも出来ます。
サイトエクスプローラは、インデックスの他に当該ページの被リンクも調べることができますので、ライバル会社さんの被リンクを調べることで、自分が知らなかった地域ポータルサイト(サイト登録できそうなところ)等も調べることが出来ます。

なお、ライバル業者さんの被リンクを調べるにはこちらのサイトが使い勝手がいいと思います。


デッドリンク(自分のサイトからのリンクが切れているもの)を調べるにはこちらのサイト(英語で書かれていますがびっくりしないで下さい)が有用です(中にはリンクが切れていないものも表示される場合があるので、候補をクリックしてサイトの存否を確認しましょう)。
(サイトは無くなってしまった模様です。)

デッドリンクに関しては、ネットで調べますとフリーソフトが色々と出回っておりますが、不具合が生じる可能性があるためあまり多用しない方がいいと思います(通常の市販ソフトですと有償なので責任があり、パソコンが壊れることが無いよう念入りにデバッグ作業が行われますが、フリーソフトですとアマチュアが他人のプログラムの記述の一部をそのまま引用・改良して作成し、人に使われることよりも自分の勉強のためプログラムを作成する意識が強く、思わぬ不具合が生じる場合があります)。


それでは今回はこのくらいにして、また来週に続きを書きたいと思います

PR