Google-Extendedをブロックする方法:Gemini学習からコンテンツを守る
Google-Extendedとは何か
Google-ExtendedはGoogleが2023年9月に導入したAI専用クローラーです。Google検索のインデックス作成には使用せず、GeminiやBardなどのGoogle AIサービスのトレーニングデータ収集を目的としています。
重要な点:Google-Extendedをブロックしても、通常のGooglebot(Google検索)には影響しません。これが他のAIクローラーとの大きな違いです。
Google-Extendedをブロックすべきか?
ブロックする場合のメリット
- GeminiがあなたのコンテンツをAIの回答に無断使用することを防げる
- AI Overviewsでのコンテンツ表示(クリックされないゼロクリック)を回避できる可能性
- 著作権的な保護を明示できる
ブロックしない場合のメリット
- Google AI Overviewsで上位表示される可能性(ブランド露出)
- GeminiがあなたのサイトをAI回答の参照源として使用する
現時点では、多くのコンテンツ制作者がGoogle-Extendedのブロックを選択しています。
方法① robots.txtでGoogle-Extendedをブロック
# Google AI(Gemini等)の学習をブロック
# 通常のGoogle検索インデックスは許可される
User-agent: Google-Extended
Disallow: /
# Googlebot は許可(検索インデックスのため)
User-agent: Googlebot
Allow: /
この設定により:
- Google検索:通常通りインデックス ✅
- Gemini学習:ブロック ✅
- Google AI Overviews:ブロック ✅
方法② 部分的なブロック(公開コンテンツのみAI許可)
SEO目的の記事はAI引用を許可し、有料コンテンツや価値の高いコンテンツだけブロックする戦略:
User-agent: Google-Extended
Disallow: /premium/
Disallow: /members/
Disallow: /private/
Allow: /blog/
Allow: /
方法③ meta タグでのコンテンツ制御
ページレベルでGoogle AI学習からオプトアウトするには、HTMLのmetaタグを使います:
<!-- 全AIインデックスをブロック -->
<meta name="robots" content="noai, noimageai">
<!-- Googleのみブロック -->
<meta name="googlebot" content="nosnippet">
Next.jsでのmeta設定
// app/layout.tsx
export const metadata = {
robots: {
index: true, // 通常の検索インデックスは許可
follow: true,
googleBot: {
index: true,
follow: true,
nosnippet: true, // Google AI Snippetをブロック
},
},
};
// または特定ページのみ
// app/articles/[slug]/page.tsx
export const metadata = {
robots: "noai, noimageai", // AI学習をブロック
};
Google Search Consoleでの確認
Google-Extendedのブロック設定後は、Google Search Consoleでrobots.txtが正しく認識されているか確認します:
- Search Console → 設定 → robots.txtインスペクター
- 「Google-Extended」を選択してテスト
- 「テスト済み」ステータスを確認
AI Overviewsへの影響
Google-Extendedをブロックすると、Google AI Overviews(AIによる検索結果上部の要約)にあなたのコンテンツが使用されなくなります。これはPV数に影響する可能性があります。
AI Overviewsによるオーガニック検索のCTR低下が問題になっているサイトでは、むしろGoogle-Extendedをブロックすることでダイレクトなクリックを維持できる場合もあります。
他のAIボットとまとめてブロックする
# Google-Extended + 主要AIクローラーをまとめてブロック
User-agent: Google-Extended
Disallow: /
User-agent: GPTBot
Disallow: /
User-agent: ClaudeBot
Disallow: /
User-agent: PerplexityBot
Disallow: /
User-agent: Amazonbot
Disallow: /
User-agent: Applebot-Extended
Disallow: /
# 通常の検索エンジンは許可
User-agent: Googlebot
Allow: /
User-agent: Bingbot
Allow: /
User-agent: *
Allow: /
監視:ブロック後もアクセスがないか確認
Googleは一般的にrobots.txtを遵守しますが、AI Access Monitorで定期的にモニタリングすることをお勧めします。無料で監視を始める →