先日、自分のBlogにあててトラックバックSPAMが大量に押し寄せてきたというお話をしました。その数およそ4700。その根拠はというと、その週の簡易なアクセスログを見たところ、libwww-perl/5.805からのアクセスが4282、libwww-perl/5.803からが536。対して攻撃を受けた日のアクセス数が4854ですから、まあ4700程度が攻撃であると見るのが妥当であると思います。
さて、攻撃を受けた日、11月16日のアクセス数をGoogle Analyticsで見てみるとどうでしょう。訪問数が109、ページビュー数が191とでましたね。しかし、Blogサービスが用意している解析では4854であるのに、Google Analyticsだと191というこの差はどこに由来するのでしょう。
単純な話です。トラックバックSPAMはページにアクセスするといっても、データをポストするだけで、HTMLも読まなければJavaScriptも実行しないからです。実は、ともったいつける必要もないほど自明な話であるのですが、Google AnalyticsはJavaScriptによって取得したさまざまな情報を画像読み込みする際にGoogleに送信することでアクセスをカウントしています。なのでJavaScriptを実行しないエージェントは、SPAMだろうが通常のトラックバックだろうがカウントされないのです。ついでにいえば、Webページを収集するロボット、検索サービスが使っているBotなんかですね、もカウントされません。そいつらもJavaScriptの実行はしないからです。
でも、ロボットなんてカウントしてもしかたないからなあ、なんて思ってはいけません。実はこれは結構重要な要素で、つまりはGoogle Analyticsにはカウント漏れが生じるということです。
カウント漏れとは穏やかではありませんが事実です。こうしたアクセス解析ツールはサイトの情報を閲覧するユーザ数をカウントし、その動向を見るために用いられるわけでありますが、ですがそのカウントをすり抜けるUAが存在します。それはどういう類いのUAかというと、JavaScriptを実行しない類いのUAです。
ええーっ、今どきJavaScriptを実行しないUAなんてあるの? なんて思う人もいるかも知れませんが、あります。Lynxとかじゃないですよ。もっと新しくて、もっと広く使われているUAがJavaScriptを無視します。それはなにかといいますと、例えばThunderBird。ThunderBirdはRSSリーダーとしても使えるため、RSSを用意することの多いBlogの閲覧には向いているUAです。実際私も、仕事先ではThunderBirdを使っています。ですが、こいつがJavaScriptを実行しない。いや、実行しなくてもいいんです。そういう用途を前提とするUAではないのですから。JavaScriptが必要であらば、Firefoxでもなんでも、Webブラウザを使えばいいだけの話なのですから。
Blogの記事を読むのに、RSSリーダーを使っている人は少なくないと思います。パワーユーザーになるほどその使用率は上がるでしょう。そして、リーダーによってはJavaScriptを実行しない。つまりカウントされない。これは、Blogによっては由々しき問題になる可能性があります。アクセスの実態を反映しないケースが多々あると、そのようにいいきってもいいのではないかと思います。
うちのBlogに関しては、Blogサービス提供の解析結果とGoogle Analyticsの結果に、それほどの差は見られません。そんなわけで、安心して一日あたり100ページビュー程度という結果を受け入れてよいようですよ。
あれだけ記事があって100ページビュー/日か……。し、しみる結果だなあ。