こんばんは。おとといに引き続き、アクセス解析関連ネタ。
現状、ppBlogでは、登録したIPアドレスによって、アクセスログに記録するかどうかを判断する機能をつけていますが、IPアドレスを逐一登録していくのは、そう楽ちんな作業ではありません。なので、stat/log.phpの方で、
if(strpos($ua, 'bot') || strpos($ua, 'Bot')) $ip_accept = FALSE;
みたいな記述をして、アクセスログへの記録を避けることができますよ、というのをいつか記事にしました。でも、ユーザーの方に直接 log.php をいじってね、というのも不親切だなぁと感じていたんで、管理画面の方で、統計除外したい任意のキーワードを指定できるようにしました。
検索エンジンのクローラーなどは、来てくれるのはありがたいのですが、それらをすべてアクセスログに記録していたら、ログの肥大化に繋がります。なので、これを避けよう、というのが基本にあります。この手のクローラーは、分かりやすいユーザーエージェント名を名乗ってくれることが多いです。例えば、グーグルなら、Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)Yahoo!なら、
Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)MSNなら、
msnbot/1.1 (+http://search.msn.com/msnbot.htm)という具合です。なので、これらの文字列に含まれる単語を指定しておくことで、アクセスログへの記録を回避できます。例えば、botというキーワードを登録しておけば、それだけで、この文字列を含んでいるGoogleとMSNのクローラーの足跡を断つことができます。
管理画面でのスクリーンショットを載せときますね。
尚、登録したキーワードは、IPアドレス除外と同じ設定ファイルnotcount.ini.phpに記録するようにしたので、特にこの処理を入れたことによるスピード低下はほとんどないと思います。
Comments