« Scratchware | top | MMOG登録者数曲線と、寝る前の空想 »

2004年10月11日

検索エンジンにたちはだかる壁?

最近、検索エンジンの検索結果に満足いかないときが増えたと感じる。
とくに、重箱の隅をつつくような細かい調べものをするときにそうなのだ。
これはリスクではないか? と思ったのですこし調べた。

まず、重箱の隅をつつくようなキーワードがあるとする。たとえば、
vce_text_split_index_get_int という、VCEに含まれているAPIを例にとる。
これは、世界で100人以下の開発者によってオンラインゲーム開発のために使われている、
もともとは私が書いたC言語用の関数である。使っている人が数十人はいるので、
重箱の隅とはいえど、捨てるべきではないだろう。
Googleがこれをみつけてくれることによって、数十人の人が年間数分づつ、
計2~3時間節約できるはずだ。それぐらいの価値の情報だ。
実際、年間合計で数百回、顧客と思われる組織からアクセスが来ている。
さらに、実際にGoogleで英語版がひっかかって、直後に日本語版に移動して
内容を見るという動きも見られた。はっきりと、
顧客の時間が無駄になっていることがわかる。

このAPIには、日本語ドキュメントと英語ドキュメントがあって、
以下の2個所で約3年間公開している。webサーバーのログを見ると、
月に数回以上はgoogleからロボットがきていることもわかっている。

VCE API reference
VCE APIリファレンス

この単語を各種の検索エンジンで検索すると、

A9 : 英語だけ
google : 英語だけ
altavista : 日本語だけ
teoma : 英語だけ
vivisimo : 日本語、英語両方

という検索結果が出る。
それぞれ、書かれた言語が異なるので、内容が同様だからといって
検索結果を少なくする理由にはならないはずだ。
また、vivisimoは一見情報量が多いようだが、ほかの単語では一般に弱い。

ここ3、4年ほどはgoogleの保有ページ数は30~50億の水準で、それほど増えてはいない。
しかしweb上にある情報の量はblogなどの流行、ネットユーザーの世界各地での増加の影響で、
指数関数的な増えかたをまだまだ続けているはずだ。ドメイン数自体も増え続けている。

てことは、検索エンジン屋は、ますますたくさんの情報を捨ててることになる。
googleは「多くの人にとってほんとうに必要な情報だけを見せればよい」
という編集哲学をもっているように思えるが、それは、
「情報を探しだす」という基本機能がしっかり機能した上でのことでなければならないはずだ。
そうでなければただの金もうけ主義だ。

検索エンジンに、現場のエンジニアにしかわからない、何らかの技術的障壁が
立ちはだかってるのだろうか?
それとも単に金もうけ主義に走っているだけなのか。

とにかく現状の検索エンジンには不満だ。

Posted by ringo : 2004年10月11日 20:23

トラックバック

このエントリーのトラックバックURL:
http://www.ce-lab.net/blog/mt-tb.cgi/631

言及リンクのないトラックバックは受け付けない設定にしています。
トラックバックスパムがあまりに多いための処置なので、ご了承ください。