アクセス解析で除外キーワード

category-icon

 こんばんは。おとといに引き続き、アクセス解析関連ネタ。

 現状、ppBlogでは、登録したIPアドレスによって、アクセスログに記録するかどうかを判断する機能をつけていますが、IPアドレスを逐一登録していくのは、そう楽ちんな作業ではありません。なので、stat/log.phpの方で、

if(strpos($ua, 'bot') || strpos($ua, 'Bot')) $ip_accept = FALSE;

みたいな記述をして、アクセスログへの記録を避けることができますよ、というのをいつか記事にしました。でも、ユーザーの方に直接 log.php をいじってね、というのも不親切だなぁと感じていたんで、管理画面の方で、統計除外したい任意のキーワードを指定できるようにしました。

 検索エンジンのクローラーなどは、来てくれるのはありがたいのですが、それらをすべてアクセスログに記録していたら、ログの肥大化に繋がります。なので、これを避けよう、というのが基本にあります。この手のクローラーは、分かりやすいユーザーエージェント名を名乗ってくれることが多いです。例えば、グーグルなら、
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
Yahoo!なら、
Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)
MSNなら、
msnbot/1.1 (+http://search.msn.com/msnbot.htm)
という具合です。なので、これらの文字列に含まれる単語を指定しておくことで、アクセスログへの記録を回避できます。例えば、botというキーワードを登録しておけば、それだけで、この文字列を含んでいるGoogleとMSNのクローラーの足跡を断つことができます。

 管理画面でのスクリーンショットを載せときますね。

shot1
このメニューから入ります。
shot2
ホスト名に含まれる文字列も指定可能です。

 尚、登録したキーワードは、IPアドレス除外と同じ設定ファイルnotcount.ini.phpに記録するようにしたので、特にこの処理を入れたことによるスピード低下はほとんどないと思います。

— posted by martin at 04:34 am   commentComment [0]  pingTrackBack [0]

この記事に対する TrackBack URL:

設定によりTB元のページに、こちらの記事への言及(この記事へのリンク)がなければ、TB受付不可となりますのであらかじめご了承下さい。

コメントをどうぞ。 名前(ペンネーム)と画像認証のひらがな4文字は必須で、ウェブサイトURLはオプションです。

ウェブサイト (U):

タグは使えません。http://・・・ は自動的にリンク表示となります

:) :D 8-) ;-) :P :E :o :( (TT) ):T (--) (++!) ?;w) (-o-) (**!) ;v) f(--; :B l_P~

     
T: Y: ALL: Online:
Created in 0.0170 sec.
prev
2017.5
next
  1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31