ECサイトがAIクローラーに狙われる理由
ECサイトの商品情報・価格・在庫・レビューは、AIモデルの学習データとして価値が高いだけでなく、競合他社による価格調査・在庫監視にも悪用されます。AIを使った自動価格収集(Price Scraping)は特に問題です。
ECサイト特有のリスク
- 価格データの競合流出:セール価格・特別価格がリアルタイムで競合に露出
- 在庫情報の漏洩:在庫切れ状況を競合が把握
- レビュー・評価データ:AI学習データとして収集
- 商品説明文の盗用:AIがそのままコピーコンテンツを生成
Shopifyでの対策
robots.txtのカスタマイズ
Shopifyはrobots.txtをLiquidテンプレートでカスタマイズできます(Shopify 2.0テーマ)。
{% comment %} robots.txt.liquid {% endcomment %}
User-agent: *
Disallow: /admin/
Disallow: /cart
Disallow: /orders
User-agent: GPTBot
Disallow: /
User-agent: ClaudeBot
Disallow: /
Shopify Functionsによるミドルウェア
Shopify Plus以上では、Functions APIを使ってリクエスト処理をカスタマイズし、AIクローラーをブロックできます。
Next.js(Headless Commerce)での実装
// middleware.ts
export function middleware(request: NextRequest) {
const ua = request.headers.get("user-agent") ?? "";
const AI_BOTS = /GPTBot|ClaudeBot|PerplexityBot|Bytespider/i;
if (AI_BOTS.test(ua)) {
// 商品ページはブロック、TOPページは許可
if (request.nextUrl.pathname.startsWith('/products/') ||
request.nextUrl.pathname.startsWith('/collections/')) {
return new NextResponse("License required", { status: 402 });
}
}
return NextResponse.next();
}
AI Access Monitorで価値を可視化
ECサイトの場合、URLパターン(/products/, /category/等)ごとのAIアクセス数を把握することが重要です。AI Access Monitorはページ種別ごとのアクセス分析が可能で、どの商品カテゴリーが最も狙われているかを特定できます。