写真家の作品とAIの関係
AIが写真サイトをクロールする理由は主に2つです。①AIの視覚理解モデル(CLIP、画像認識モデルなど)の学習データとして使用する、②ALT属性・ファイル名・ページテキストと画像の対応関係を学習する。どちらもあなたの許諾なしに行われています。
写真サイト特有のリスク
写真家サイトでは特に以下のリスクがあります:
- 画像の直接URL収集 —
/photos/、/gallery/配下の画像ファイルがクロールされる - EXIF情報の収集 — 撮影地・カメラ機種・撮影日時などのメタデータ
- 作品スタイルの模倣 — 特定カメラマンの構図・色調をAIが学習して類似画像を生成
- ウォーターマークの無効化 — AIはウォーターマーク付き画像からでも構造を学習できる
対策① robots.txtの設定
# 写真家サイト向けrobots.txt
User-agent: GPTBot
Disallow: /
User-agent: Diffbot
Disallow: /
User-agent: CCBot
Disallow: /
User-agent: ClaudeBot
Disallow: /
User-agent: anthropic-ai
Disallow: /
# 画像ディレクトリは全botから保護
User-agent: *
Disallow: /photos/
Disallow: /gallery/
Disallow: /images/
Disallow: /assets/img/
Allow: /
対策② X-Robots-Tag ヘッダー
robots.txtに加え、画像配信時にHTTPヘッダーを設定することで二重の保護ができます。
# Nginx: 画像ファイルへのAI収集を拒否
location ~* .(jpg|jpeg|png|webp|gif)$ {
add_header X-Robots-Tag "noai, noimageai" always;
}
noai と noimageai はAIトレーニングへの使用を拒否するための新しいディレクティブです(主要AI企業が対応を表明)。
対策③ WordPress + フォトギャラリープラグイン
Envira Gallery・FooGallery・NextGENなどのギャラリープラグインを使っている場合、以下を functions.php に追加します。
// 画像ページにX-Robots-Tagヘッダーを追加
add_action('send_headers', function() {
if (is_attachment() || is_singular('attachment')) {
header('X-Robots-Tag: noai, noimageai');
}
});
アクセス記録で著作権侵害の証拠を残す
AI Access Monitorのダッシュボードでは、/photos/ や /gallery/ などのパスへのAIクローラーアクセスを可視化します。robots.txtでDisallowを設定した後もアクセスが続いた場合、それは著作権侵害の明確な証拠になります。