リファラースパムを除外してアクセス解析の精度を上げよう。

「アクセス数」という言葉は今ではPV(ページビュー)と同義で使われることが多く、インバウンド全体からリファラースパム(referer spam)を除いたものがオーガニックなアクセスと言えます。

アクセス解析ツールはリンクをクリックしてWEBサイトにアクセスする際に送られるリンク元ページ情報であるHTTPリファラーを解析します。

アクセス解析ツールを使う目的

アクセス解析ツールを使う目的は主に以下の3つあり、ツールによって得意不得意があります。

  1. インバウンドの数と質(ビジター・ページビュー・リファラー・検索キーワードetc.)
  2. コンバージョン分析(サイトの目的達成アクセス)
  3. アウトバウンドの数と質(直帰率・離脱率etc.)

現在のところインバウンドの方法として考えられるのは主に以下のような種類あり、問題は実在しないリンクからHTTPリファラーだけを送りつけるスパムがあることで、サイトのアクセス解析の妥当性を大きく損なう忌々しい存在です。

  1. 検索エンジン(完全オーガニック)
  2. PCサイトのリンク(オーガニックリンク・リスティング広告)
  3. アドレスバー・ブックマーク(ノーリファラー)
  4. Twitterアプリ・Facebookアプリ(ノーリファラー)
  5. リファラースパム

「他人にどう見られているか気になる」傾向が強い日本人なら誰しもリンク元がどんなサイトなのか気になるはずw。単なるショッピングサイトやアフィリエイトサイトへの誘導ならいいですが、ウィルス仕込まれたサイトに誘導された日にはたまったもんじゃありません。

アクセス解析とは

クライアント(Webブラウザ)とWebサーバとがデータを送受信するのに使われるのがHTTPプロトコルであり、あるページにあるリンクをクリックして別のウェブページを訪れるとき、ブラウザはHTTPヘッダーとしてそのリンクが置かれているウェブページのURLをリファラー情報として送信します。

refererspam

当サイトへのリファラースパムはロシアのエロサイトかファッションサイトが多く、これらのサイトには実際にはリンクは存在しないにもかかわらずリファラー情報(リンク元のURL)だけ無差別に送りつけて来ます。特徴としては同じページに3回ほぼ同時刻にアクセスしてくるので、「直近の(アクセス)状況」と「直近のリファラー」「直近のページ」に3つセットで怪しいリファラーURLとして記録されています。

当サイトの場合はアクセス解析ツールのリファラー画面に表示されるだけなので、僕自身がリンクをクリックしない限りエロサイトへの流入効果はないでしょうが、訪問者数ランキングサイトなんかにはこれらのエロサイトのリンクが自動で生成される場合があり、それなりの流入が期待できると言えます。

ちなみオーガニック検索とは、Googleの検索結果のうちリスティング広告(検索結果ページに検索語と関連性の高い広告を選択して表示する広告)などの結果を含まない部分のことで、Web上から集めてきたデータをGoogleのアルゴリズムで順位付けした本来の検索結果を表します。

リファラースパムはGoogle Analyticsのフィルタ設定で完全シャットアウト可能ですが、結局いたちごっこなのでキリがないような気もしています。

refferer-spam

WordPressのStatPress reloaded

動作が非常に重いという欠点を補って余りあるプラグインで、お手軽にアクセス解析の指標を分析できます。インバウンドの分析のみで満足なら機能的に十分だが、コンバージョンやアウトバウンドの分析を行うためにはGoogle Analyticsを併用することになります。

  1. 来訪者:ホームページ訪問者数
  2. ページビュー:アクセス数と同じ。閲覧されたページ数
  3. スパイダー:検索ロボットが巡回してきた回数
  4. フィード:フィードの購読者数
  5. 直近の状況:アクセスのあったページ
  6. 直近の検索キーワード:どんなキーワードで検索してきたか
  7. 直近のリファラー:どのページからサイトに訪れたかのURL
  8. 直近のユーザーエージェント:アクセスしてきた端末のブラウザ情報
  9. 直近のページ:アクセスのあったページ
  10. 直近のスパイダー:検索ロボットが巡回してきた回数

追跡機能により誰が(どのIP)がどのページにアクセスしてきたかが時系列で判るので便利。特にリファラースパムの3セット同時刻同ページへのアクセスが一目で判別できます。
tracking

Google analytics(アナリティクス)

Google analyticsは高機能で全部使いこなすのは大変ですが、敢えてStatPressの違いを挙げてみると・・・

  1. アウトバウンドの分析可能
  2. リアルタイム機能
  3. 複数サイトのアクセス解析一元管理
  4. コンバージョンの目標を設定し分析可能

その結果、以下のようなアクセス解析の指標が追加されます。

  1. セッション:一定時間内にサイトを訪れて離脱するまでの行動を1セッションとする。
  2. 直帰率:最初の1ページ見て離脱=直帰する率。
  3. 離脱率:特定のページから別のサイトに離脱したユーザーの割合
  4. コンバージョン:訪問者がサイトの目標を達成した回数

まずサイトにGoogle Analyticsを導入するには、トラッキングコードというJava Scriptを各ページのヘッダーに埋め込む必要がありますが、WordPressなどブログの場合はトラッキングIDを設定するだけでヘッダーテンプレートにトラッキングコードを埋め込んでくれるプラグインGoogle Analytics for WordPressがあるので便利です。

googleanalytics

Google analyticsの複数サイト一元管理を実現しているのはアカウント・プロパティ・ビューという3階層構造です。例えば「インドネシアITなび」と「LAUNCH IT@JKT BLOG」という2つのサイトを別々にアクセス管理する場合には2つのプロパティを作成し、トラッキングIDは枝番違いで管理されます。それぞれのプロパティには自動的に「すべてのウェブサイトのデータ」というビューが生成され、サイトからGoogle Analyticsのプロパティに送られてきたデータをビューに保存し、ビューを元にレポートが作成されます。よってビューにフィルタを設定して特定のアクセスのみを対象としたアクセス解析が可能になります。

menu-g

具体的なメニューとして以下メインメニューの下にサブメニューが複数あります。まずは各メインメニューにある「サマリー」を見ることになると思います。

  1. リアルタイム:今現在どこから何人がアクセスしているか。
  2. ユーザー:セッション数, ユーザー数, ページビュー数, 直帰率など基本情報。
  3. 集客:オーガニックサーチ, リファラー, ダイレクト, ソーシャルなどどこから集客したか。
  4. 行動:ページごとのアクセス数
  5. コンバージョン:目標達成率

こんな投稿も読まれています