·9分で読める

AIクローラーの検知方法完全ガイド:User-Agent・IPレンジ・行動パターン

GPTBot・ClaudeBot・PerplexityBotなどのAIクローラーをUser-Agent文字列・IPアドレス・クロール行動パターンから検知する方法を網羅的に解説します。

AIクローラー検知User-AgentIPレンジ

AIクローラー検知の3つのアプローチ

AIクローラーを検知する方法は主に3つあります。精度と実装コストのトレードオフを理解して使い分けましょう。

①User-Agentによる検知(最も簡単)

主要AIクローラーの完全なUser-Agent一覧:

クローラーUser-Agent文字列
GPTBotGPTBot/1.1
OAI-SearchBotOAI-SearchBot/1.0
ChatGPT-UserChatGPT-User/1.0
ClaudeBotClaudeBot/0.5
anthropic-aianthropic-ai/1.0
PerplexityBotPerplexityBot/1.0
Google-ExtendedGoogle-Extended
BytespiderBytespider (+https://zhanzhang.toutiao.com/)
CCBotCCBot/2.0
cohere-aicohere-ai/1.0
YouBotYouBot
DiffbotDiffbot/0.1
AmazonbotAmazonbot/0.1
MistralBotMistralBot

限界:User-Agentは偽装可能です。悪意あるクローラーには通用しません。

②IPアドレス・ASNによる検知

主要AI企業のASN(自律システム番号):

  • OpenAI:AS396982(Google Cloud経由)
  • Anthropic:逆引きDNSで *.anthropic.com を確認
  • Perplexity:AS16509(AWS)
# 逆引きDNSでの確認例(Python)
import socket
ip = "20.171.207.214"
try:
    hostname = socket.gethostbyaddr(ip)[0]
    is_ai_bot = "openai.com" in hostname or "anthropic.com" in hostname
except:
    is_ai_bot = False

③行動パターンによる検知

AIクローラーに特有の行動パターン:

  • 短時間に大量のページをクロール(秒間5〜20リクエスト)
  • JavaScriptを実行しない(Headlessでない)
  • Cookieを保持しない
  • 画像・CSS・JSファイルをリクエストしない
  • User-Agentに明示的にbot名を含む

AI Access Monitorで自動検知

AI Access Monitorは上記3つの方法を組み合わせ、28種のAIクローラーをリアルタイムで自動検知します。1行のコードを追加するだけで即日計測開始できます。

AI Access Monitor

まず計測から始めよう

1行のコード追加で、AIクローラーの計測を今日から開始。無料・設定不要。

無料で始める →