·7分で読める

Google-Extendedをブロック・制御する方法

GoogleのAI学習用クローラー「Google-Extended」の仕様と、Gemini・Bardモデルへのデータ提供を拒否する設定方法を詳しく解説します。

Google-ExtendedGeminiAIクローラーrobots.txt

Google-Extendedとは

Google-ExtendedはGoogleが2023年に導入した独立したUser-Agentで、GeminiモデルをはじめとするGoogle AIの学習データ収集に特化したクローラーです。従来のGooglebotとは別に動作し、robots.txtで個別に制御できます。

User-Agent: Google-Extended

Googlebotとの違い

クローラー用途robots.txtで制御
Googlebot検索インデックス可(ブロックすると検索除外)
Google-ExtendedAI学習データ収集可(検索順位に影響なし)

重要:Google-Extendedをブロックしても、Google検索のインデックスには影響しません。SEOを維持しながらAI学習データ提供を拒否できます。

robots.txtでブロック

# Google検索は許可、AI学習のみ拒否
User-agent: *
Allow: /

User-agent: Google-Extended
Disallow: /

特定ディレクトリのみブロック

User-agent: Google-Extended
Disallow: /blog/
Disallow: /docs/
Allow: /

Next.js robots.tsで設定

import { MetadataRoute } from "next";

export default function robots(): MetadataRoute.Robots {
  return {
    rules: [
      { userAgent: "*", allow: "/" },
      { userAgent: "Google-Extended", disallow: "/" },
    ],
    sitemap: "https://yourdomain.com/sitemap.xml",
  };
}

AI Access Monitorで計測

Google-Extendedがあなたのサイトを何回クロールしているか、AI Access Monitorでリアルタイム確認できます。設定変更後のブロック効果も数値で確認できます。

AI Access Monitor

まず計測から始めよう

1行のコード追加で、AIクローラーの計測を今日から開始。無料・設定不要。

無料で始める →