AI学習オプトアウト全サービス一覧【2026年版】
AI学習オプトアウトとは
あなたのWebサイトのコンテンツが、大手AI企業の言語モデルトレーニングに使用されることを拒否する手続きが「AI学習オプトアウト」です。2023年以降、主要AI企業が相次いでオプトアウト手段を提供し始めており、2026年現在では多くのサービスで対応が整っています。
オプトアウトには主に2つの方法があります:
- robots.txt:クロール自体を拒否する(事前予防)
- 申請フォーム・メール:すでに収集されたデータの削除を求める(事後対応)
【OpenAI】GPTBot・OAI-SearchBot
クローラー名:GPTBot、OAI-SearchBot
目的:GPT系モデルのトレーニング、ChatGPT Search
robots.txtでのブロック
# GPT-4等のトレーニングデータ収集をブロック
User-agent: GPTBot
Disallow: /
# ChatGPT Searchのインデックスをブロック
User-agent: OAI-SearchBot
Disallow: /
削除申請:privacy@openai.com または OpenAI Privacy Portal
【Google】Google-Extended・Googlebot
クローラー名:Google-Extended
目的:Gemini・Bard等のGoogle AIモデルのトレーニング
# Google AI(Gemini等)の学習をブロック
User-agent: Google-Extended
Disallow: /
# 通常の検索インデックスは許可する場合
User-agent: Googlebot
Allow: /
注意:Google-ExtendedをDisallowにしても、通常のGooglebotによる検索インデックスは継続します。
【Anthropic】ClaudeBot・anthropic-ai
クローラー名:ClaudeBot、anthropic-ai
目的:Claudeモデルのトレーニング
User-agent: ClaudeBot
Disallow: /
User-agent: anthropic-ai
Disallow: /
削除申請:privacy@anthropic.com
【Perplexity AI】PerplexityBot
User-agent: PerplexityBot
Disallow: /
削除申請:support@perplexity.ai
【Amazon】Amazonbot
User-agent: Amazonbot
Disallow: /
【ByteDance/TikTok】Bytespider
User-agent: Bytespider
Disallow: /
注意:Bytespiderはrobots.txtを無視するケースが報告されています。サーバーサイドブロックも併用を推奨。
【Common Crawl】CCBot
User-agent: CCBot
Disallow: /
削除申請:info@commoncrawl.org(既存データの削除は困難な場合あり)
【Cohere】cohere-ai
User-agent: cohere-ai
Disallow: /
【Meta】FacebookBot(学習目的)
# Metaの学習用クローラー
User-agent: Meta-ExternalAgent
Disallow: /
【Apple】Applebot-Extended
# Apple AI(Siri・Apple Intelligence)の学習をブロック
User-agent: Applebot-Extended
Disallow: /
# 通常のApplebotは許可する場合
User-agent: Applebot
Allow: /
まとめて全AIをブロックするrobots.txt
# ===== AI学習クローラー全ブロック =====
User-agent: GPTBot
Disallow: /
User-agent: OAI-SearchBot
Disallow: /
User-agent: Google-Extended
Disallow: /
User-agent: ClaudeBot
Disallow: /
User-agent: anthropic-ai
Disallow: /
User-agent: PerplexityBot
Disallow: /
User-agent: Amazonbot
Disallow: /
User-agent: Bytespider
Disallow: /
User-agent: CCBot
Disallow: /
User-agent: cohere-ai
Disallow: /
User-agent: Meta-ExternalAgent
Disallow: /
User-agent: Applebot-Extended
Disallow: /
User-agent: MistralBot
Disallow: /
# 通常の検索エンジンは許可
User-agent: *
Allow: /
Sitemap: https://yourdomain.com/sitemap.xml
robots.txtだけでは不十分:監視ツールの活用
robots.txtを設定しても、新たなAIクローラーが登場するたびに手動で追加が必要です。また、robots.txtを無視するクローラーへの対策も必要です。
AI Access Monitorでは、30種類以上のAIクローラーを自動検知し、新しいボットが追加されると即座に通知します。無料で始める →