技術情報

特定のユーザーエージェントを持つすべてのリクエストを統計から除外するにはどうすればよいですか?

 

時々、あなたのウェブサイトを訪問する人間ではない(ボット)が存在します。これらのボットには様々な目的があります(セキュリティスキャン、パフォーマンススキャン、モニタリング、検索エンジンボット、スパムボットなど)。多くの場合、Matomo (Piwik)でこれらのボットを追跡させたくありません。なぜなら、ボットではなく、人間がどのようにウェブサイトを利用するかに焦点を当てたいからです。この場合、リクエストのUser-Agentが指定した文字列と一致するトラフィックを除外するようにMatomoに指示することができます。

デフォルトでは追跡されないボットもある

特定のユーザーエージェントを持つ訪問の一部は、Matomoによってボットとして検出され、追跡されません。ユーザーエージェントがボットとして検出されるかどうかは、Matomo > 管理 > 診断 > デバイス検出 でテストできます。User-Agent” テキストフィールドに、確認したいユーザーエージェントをコピーペーストしてください。またdevicedetector.net でオンラインで確認することもできます

新しいボットを追跡対象から外すには?

特定のユーザーエージェント(または複数のユーザーエージェント)のトラフィックを除外するには、”管理 “に行き、”ウェブサイト”(または “測定値”)セクションの下にある “設定 “をクリックしてください。ウェブサイトのリストの下に、「除外するユーザエージェントのグローバルリスト」を指定するオプションがあります。そこに、Matomoによる追跡から除外するユーザエージェントのリストを入力することができます。1行に1つのユーザエージェントを入力してください。訪問者のユーザエージェント文字列が指定した文字列のいずれかを含む場合、その訪問者はMatomoから除外されます。また、”Enable website specific user agent exclusion. “のチェックボックスを切り替えて、ウェブサイト一覧の各ウェブサイトの新しい列としてこの機能を有効にすることもできます。

Matomo 4.1.1では、正規表現を使ってユーザエージェントを除外することもできます。/bot|spider|crawl|scanner/i).

注釈

  • あるトラフィックを除外した場合、そのトラフィックは今後除外されるだけで、過去にさかのぼって適用されることはありません。
  • 非常に短い文字列(文字数が少ない)は、予想以上に多くのリクエストをブロックする可能性があるため、含めないように注意してください。

こちらも参照のこと:IPアドレスまたはIP範囲からのトラフィックを除外