AIクローラーは漫画サイトも狙っている
「自分の漫画サイトにAIクローラーが来ているか確認したことはありますか?」Webサーバーのアクセスログを見ると、GPTBot・ClaudeBot・Diffbotといったクローラーが、あなたの作品ページを毎日巡回していることがわかります。
これらのAIクローラーが収集したコンテンツは、次世代の画像生成AI・テキストAIの学習データになる可能性があります。漫画のコマ・セリフ・ストーリー展開が無断で使われているとしたら、それは著作権の問題です。
どんなページが狙われているか
特にアクセスが集中しやすいのは以下のようなページです。
/works/や/manga/配下の作品一覧・詳細ページ- 試し読みページ(
/preview/、/sample/) - 画像ファイルの直接URL(
/img/、/assets/) - 同人誌の概要・あらすじページ
AI Access Monitorを導入すると、どのURLにどのクローラーが何回アクセスしたかをダッシュボードで可視化できます。
方法① robots.txtで全AIをブロック
User-agent: GPTBot
Disallow: /
User-agent: ClaudeBot
Disallow: /
User-agent: anthropic-ai
Disallow: /
User-agent: Diffbot
Disallow: /
User-agent: CCBot
Disallow: /
User-agent: PerplexityBot
Disallow: /
User-agent: Google-Extended
Disallow: /
User-agent: Bytespider
Disallow: /
robots.txtはサイトルートに置くだけで有効です。ただし「紳士協定」なので、無視するクローラーにはサーバー側のブロックが必要です。
方法② Nginx/Apacheでサーバー側ブロック
nginx.confで確実にブロックするには:
map $http_user_agent $block_ai {
default 0;
"~GPTBot" 1;
"~ClaudeBot" 1;
"~Diffbot" 1;
"~CCBot" 1;
"~PerplexityBot" 1;
"~Bytespider" 1;
}
if ($block_ai) {
return 403;
}
方法③ 画像へのホットリンクを防ぐ
画像ファイルを直接クロールさせないためのNginx設定:
location ~* .(jpg|jpeg|png|gif|webp)$ {
valid_referers none blocked yourdomain.com *.yourdomain.com;
if ($invalid_referer) {
return 403;
}
}
法的な観点:漫画・同人誌の著作権
日本の著作権法では、AI学習目的であっても著作権者の許諾なしに著作物を複製することは、権利侵害となりえます(2019年改正後も「著しく著作権者の利益を害する場合」は適用除外とならない)。
robots.txtでDisallowを指定した後もクローラーがアクセスし続けた場合、これは著作権侵害の証拠として使用できます。AI Access Monitorはこのアクセスログを訴訟証拠として保存します。