AI学習と著作権法:Webコンテンツは保護されるのか【2025〜2026年最新】
※本記事は法律情報の提供を目的としており、法的アドバイスではありません。具体的な法的判断は弁護士にご相談ください。
問題の核心:AIはWebをコピーして学習している
大規模言語モデル(LLM)のトレーニングには、Web上から収集された膨大なテキストデータが使われています。このプロセスでは、あなたのブログ記事・技術ドキュメント・小説・詩などが無断でコピー・処理されています。
では、これは著作権侵害にあたるのでしょうか?
日本法の状況:TDM例外と著作権法30条の4
日本の著作権法には、2018年の改正で「情報解析(TDM:Text and Data Mining)のための著作物利用」に関する例外規定が設けられました。
著作権法30条の4の内容
「著作物に表現された思想又は感情の享受を目的としない利用」は著作権侵害にあたらないとされています。この規定により、情報解析(AIトレーニングを含む)目的での著作物利用は原則として合法とされています。
しかし例外も存在する
「著作権者の利益を不当に害することとなる場合」は例外規定の対象外です。具体的には:
- 著作権者がオプトアウトを明示している場合(robots.txtなど)
- クロールが技術的保護手段を回避して行われた場合
- アクセス制御(ログイン必要なコンテンツ)を突破した場合
2025年の文化庁の解釈指針では、robots.txtによるオプトアウト指定は「著作権者の意思表示」として法的に意義を持つとされています。
米国法の状況:フェアユースと進行中の訴訟
米国ではフェアユース(公正利用)の法理のもとで判断されます。2023〜2026年にかけて複数の大型訴訟が進行しています。
主な訴訟事例
- The New York Times v. OpenAI(2023年):NYTが数百万本の記事の無断学習を理由に提訴。2025年現在も審理中
- Authors Guild v. OpenAI:米国作家協会がOpenAIを集団訴訟
- Getty Images v. Stability AI:画像の無断学習についての訴訟
フェアユースの4要素
米国著作権法107条のフェアユース判断基準:
- 利用の目的と性質(商業目的か非商業目的か)
- 著作物の性質
- 利用された量と質
- 潜在的市場への影響
AI企業側は「変容的利用(transformative use)」を主張していますが、裁判所の最終判断は出ていません。
EU法の状況:TDM例外とオプトアウト権
EUの著作権指令(DSM指令、2019年)では、商業目的のTDMについては著作権者がオプトアウトを指定できると明記されています。
重要なのは、EU法はrobots.txtによるオプトアウト指定を法的に有効と認めている点です。これは日本法より明確な保護を提供します。
コンテンツ制作者が今すぐできること
1. robots.txtでオプトアウトを明示する
日本法でもEU法でも、オプトアウトの意思表示は法的に意義を持ちます:
User-agent: GPTBot
Disallow: /
User-agent: ClaudeBot
Disallow: /
# ... (主要AIクローラーを列挙)
2. アクセスログを保全する
将来の法的対応に備えて、AIクローラーのアクセス記録を保存しておきましょう。AI Access MonitorのPro機能「訴訟証拠ログ」は、robots.txt違反アクセスを自動記録します。
3. AI企業への削除申請
すでに学習されたコンテンツの削除を求めることができます:
- OpenAI:privacy.openai.com
- Google:検索コンソールのコンテンツ削除ツール
- Anthropic:privacy@anthropic.com
4. ライセンス料を請求する
無断利用への対応として、使用料を請求するという方法もあります。AI Access MonitorのPro機能では、AIクローラーに対してHTTP 402(Payment Required)を返しライセンス契約を促すコードを生成できます。
2026年の展望
AIと著作権をめぐる法整備は急速に進んでいます。日本でも文化庁のAIと著作権に関する検討会が継続中であり、2026年中に新たなガイドラインが出る見通しです。
今のうちにrobots.txtの設定とアクセス監視を始めておくことが、法的保護を受けるための第一歩です。AI Access Monitorで無料監視を始める →