mt-search.cgiの負荷に対するrobots.txtの効果

| | コメント(0) | トラックバック(1) mt-search.cgiの負荷に対するrobots.txtの効果

前々からサーバに対する負荷が気になっていた。
movabletype自体の負荷だと思っていたのだが、実際にはある特定のファイルが原因ということが調べていく過程でわかった。

Movable Typeの検索機能を担うmt-search.cgiですが、これがまた激しく検索が遅くて重い。サーバーにもかなりの負荷が掛かってる模様。サーバーやさんに申し訳ないのでmt-search.cgiを止めることにしました。

ようするに、mt-search.cgiが激重ということなんですね。

このブログで使っているMovable Typeのサーチ機能を提供するのがmt-search.cgi。単にPerlのパターン・マッチングを使っているだけなんで、非常~に低速で重たいサーチ機能なんですよ。いくらうちの環境が「どん亀」とはいえ、CPUパワーの9割以上を持っていかれますヽ(;´д`)ノ

「mt-search」で調べると「mt-search.cgiを捨てて簡単メタサーチにしてみよう - Ogawa::Memoranda」とか「mt-search.cgiの代替プログラム。 (Junnama Online (Mirror))」というように、プログラム自体を変更するという話題が多いです。
もちろん、プログラム自体の負荷を軽くしてやるのも効果はあるわけですが、アクセスログとかを追っていくと、結局のところ、人間様じゃなくロボットが大量に収集していくのが問題なんですね。
ロボットに収集をやめさせるほうが効果が高いのではないかと思ってやってみました。

検索ロボットに指示するには「robots.txt」を使います。
昔はあまり意味が無かったようですが、最近は大手のロボットは解釈するようになったらしいです。

ASY!Yahoo,Google,Microsoft(Live Search)の3社は、自身の運用するクローラーがRobots.txtを承認するという取り決めを行っています。これによりrobots.txtの信用力は格別のものとなり、安心して使えるようになりました。(参考サイトYahoo Search Blog)

なので、その効果を体感するためにも、「robots.txt」での対応をしてみました。

とりあえず、過去のブログに対してはプログラムが入っているディレクトリへのアクセスを禁止しました。
http://blog.nqou.net/robots.txt

その結果、対策前のある一日のxreaでいう負荷ポイントが557だったのが、ここ最近は0から86になっていました。
同じ日の「mt-search.cgi」へのアクセス数は284でしたが、少し負荷のあったこの前の木曜日のアクセス数は10未満でした。

mt-search.cgiを置き換えるまでも無く、十分に効果を得ることができました。

トラックバック(1)

このブログ記事に対するトラックバックURL:

このブログ記事を参照しているブログ一覧:

今まで、googleのサイトマップに対応したサイトマップを生成していた。 しかし... 続きを読む

コメントする

Google検索

Last.fm

このブログ記事について

このページは、のぶりんが2008年8月17日 13:19に書いたブログ記事です。

ひとつ前のブログ記事は「完全復活」です。

次のブログ記事は「sitemaps0.90に対応したmovabletypeのテンプレート」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

ウェブページ

Creative Commons License
このブログのライセンスは クリエイティブ・コモンズライセンス.
Powered by Movable Type 4.23-ja