OpenAIのGPT、GoogleのGemini、AnthropicのClaudeといった大規模言語モデルが驚異的な能力を示すとき、根本的な法的・経済的問いが浮上する——これらのモデルは訓練データの著作権を侵害しているのか? 訴訟が増加している——ニューヨーク・タイムズがOpenAIを提訴し、ゲッティ・イメージズがStability AIを提訴し、作家たちの集団訴訟が相次いでいる。しかし経済学的視点からは、著作権の過保護はその本来の政策目的を達成しないだけでなく、AI時代における国家の競争力を失わせる可能性がある。本稿は知的財産の経済的本質から出発し、AI時代における著作権保護の最適水準を再検討する。
一、知的財産の経済的本質
著作権は手段であり、目的ではない
知的財産制度が存在するのは、「創作者は当然にその作品を所有する」という道徳的直観のためではなく、イノベーションと創作を促進するという明確な政策目的のためである。米国憲法第1条第8節第8項は、連邦議会が「科学と有用な技芸の進歩を促進するために、著作者と発明者に対して、それぞれの著作と発見に対する排他的権利を限られた期間保障する」権限を有すると明記している。この文言は排他的権利が「手段」であり、科学と技芸の進歩の促進が「目的」であることを明確にしている。[1]
この功利主義的な知的財産観は、大陸欧州の自然権の伝統と対照をなす。自然権理論の下では、創作者のその作品に対する権利は先天的かつ不可分である。功利主義的枠組みの下では、著作権は「全体的な社会的厚生を促進する」場合にのみ正当化される。著作権保護のコストがベネフィットを上回る場合、保護の水準を調整すべきである。[2]
ノーベル経済学賞受賞者ロナルド・コースの取引費用理論は、知的財産を理解するための深い枠組みを提供する。コースは、財産権は取引費用を最小化するよう画定されるべきであり、それによって効率的な資源配分を促進すべきだと論じた。知的財産権が、後続のイノベーターが無数の権利保有者とライセンス交渉を行わなければならないように画定されると、取引費用は法外なものとなり、実際にはイノベーションを阻害しうる。[3]
最適保護水準:経済学的トレードオフ
経済学者ウィリアム・ランデスとリチャード・ポズナーは、その古典的著作『知的財産法の経済構造』において、著作権保護のコストとベネフィットを分析した。保護のベネフィットは創作のインセンティブ付与——創作者がその作品から見返りを得られなければ、創作へのインセンティブは低下する。保護のコストには、作品の流通・利用の制限、後続の創作コストの増大、独占的レントの発生が含まれる。[4]
最適保護水準は限界便益が限界費用に等しくなる点にある。問題は、現行の著作権制度がこの最適点を遥かに超えている点にある。米国では著作権保護期間は著作者の死後70年。EUも同様に死後70年である。つまり30歳の創作者の作品は、創作後120年以上にわたり保護される可能性がある。このような長期間の保護がイノベーションに正の効果をもたらすことを支持する経済分析は存在しない。[5]
経済学者ルーファス・ポロックの研究は、社会的厚生最大化の観点から最適な著作権保護期間は約15年と推計する——現行の死後70年より遥かに短い。この期間を超えた保護は、限界費用(利用と後続の創作の制限)が限界便益(創作のインセンティブ付与)を上回り、社会的厚生の純損失をもたらす。[6]
二、「反コモンズの悲劇」:過保護のコスト
コモンズの悲劇から反コモンズの悲劇へ
経済学を学ぶ者なら誰でも「コモンズの悲劇」を知っている——資源に明確な財産権が設定されていないと、過剰利用される。しかし経済学者マイケル・ヘラーは、同様に重要だがあまり議論されていない概念を提示した——「反コモンズの悲劇」——財産権が過度に細分化されると、逆説的にその資源は「過少利用」されるのだ。[7]
ある川に100の水門があり、それぞれが異なる人によって管理されている状況を想像してほしい。この川を航行しようとする船舶は、100人すべての水門管理者と交渉しなければならない。たとえ各水門管理者の手数料が完全に合理的であったとしても、交渉の取引費用は航行を事実上不可能にするだろう。これが反コモンズの悲劇の本質である——あまりに多くの権利保有者がそれぞれ拒否権を持ち、結果として資源を効果的に活用できなくなるのだ。
知的財産の領域は反コモンズの悲劇に直面している。大規模言語モデルの訓練データは数十億のウェブページ、数百万冊の書籍、無数の論文や記事から来ている可能性がある。すべてのデータの使用に許諾が必要であれば、取引費用は天文学的になる。たとえすべてのデータの出所を技術的に追跡してマイクロライセンス料を支払うことが可能であっても、数百万の権利保有者との交渉のコストはAI開発を事実上不可能にするだろう。[8]
「特許の藪」の教訓
反コモンズの悲劇はすでに特許分野で痛ましい教訓を生んでいる。バイオテクノロジーにおける「特許の藪」現象はその一例である。遺伝子配列、タンパク質構造、研究ツールなどの基礎的発見がすべて特許で保護されると、後続の創薬開発は無数の特許からなる「藪」をかき分けなければならず、あらゆるステップで何らかの特許を侵害するリスクがあり、ライセンス交渉が必要となる。これが創薬開発のコストと不確実性を劇的に増大させるのだ。[9]
ヘラーとアイゼンバーグの研究は、過度な知的財産保護がバイオメディカルのイノベーションを加速させるどころか減速させうることを実証した。同じ論理がAI分野にも当てはまる。すべての訓練データが許諾を要する著作物として扱われれば、AI開発は際限のない法的紛争とライセンス交渉の泥沼に陥るだろう。[10]
三、AI訓練と著作権:経済学的分析
機械学習の本質:学習か複製か?
AI訓練の技術的本質を理解することは、法的・経済学的分析にとって不可欠である。大規模言語モデルの訓練プロセスは、モデルに膨大なテキストを「読ませ」、言語の統計的パターン——単語の共起、構文構造、意味的関係など——を学習させるものである。訓練後、モデルは元のテキストを「保存」しているのではなく、学習されたパターンを数十億のパラメータに符号化しているのだ。[11]
このプロセスは「複製」というよりも「学習」に近い。ある人間の作家が大量の文学作品を読み、独自の文体を発展させたとしても、読んだ作品の著作権を「侵害」したとは言わない。AI訓練のプロセスは根本的にこれと類似している——大量のテキストから抽象的なパターンを抽出するのであって、特定のコンテンツを記憶しているのではない。[12]
もちろん、AI訓練と人間の学習には相違点もある。AIは人間よりも遥かに多くのデータを処理できる。AIの「読書」は原文の技術的複製を伴う(一時的であっても)。そして場合によっては、AIが訓練データに高度に類似するコンテンツを「記憶」して出力する可能性がある。これらの相違点は法律上慎重に対処される必要があるが、AI訓練が著作物を使用することを広く禁止する根拠として用いられるべきではない。
フェアユース法理の経済的論理
米国著作権法の「フェアユース」法理は、著作権の境界線の問題を処理する重要なメカニズムである。フェアユースは一定の状況——論評、批評、報道、教育、学術研究を含む——において著作物の無許諾使用を認める。フェアユースの判断は四つの要素を考慮する:使用の目的、著作物の性質、使用された割合、市場への影響。[13]
経済学的視点からは、フェアユース法理は「最適例外」の設計を体現している。完全な著作権保護が多くの価値ある派生的利用を阻害することを認識し、限界的な社会的便益が限界的なコストを上回る場合に無許諾使用を認めるのである。論評、批評、教育などがフェアユースに含まれるのは、これらの使用が生み出す社会的価値が、通常、原著作権者への害を上回るからにほかならない。[14]
AI訓練はフェアユースとみなされるべきか? 経済学的分析の観点からは、答えは肯定に傾く。AI訓練の目的は「変形的」——原著作物の代替を意図しておらず、そこから抽象的な知識を抽出することを目的としている。AI訓練の原著作物の市場への影響は間接的である——GPTが存在するからといってニューヨーク・タイムズの購読をやめる人はいない(もしいるとすれば、それはGPTのアウトプットの方がニーズをよりよく満たしているからであり、それこそが技術進歩の本質である)。[15]
「出力」と「訓練」の区別
重要な法的・経済学的区別は、AIの「訓練プロセス」とAIの「出力コンテンツ」を別個に扱うべきだということである。訓練プロセスは大量のデータからの統計的学習であり、このプロセス自体は著作権侵害とみなされるべきではない。人間の読書が侵害を構成しないのと同様である。しかし、AIの出力が保護された著作物に「実質的に類似」している場合、その特定の出力は侵害を構成しうる。[16]
この区別は合理的である。AI開発者が幅広い訓練データを使用することを認めつつも、原著の創作者を直接的な「コピー&ペースト」型の侵害から保護する。また責任をより適切な位置に置く——AI開発者は訓練データに過度に類似するコンテンツを出力しないシステムの設計に責任を負い、AIに意図的に保護されたコンテンツを出力させるユーザーも相応の責任を負うべきである。
四、国際比較:異なる政策選択
日本:AI向け著作権改革を積極的に受容
主要経済国の中で、日本は最もAI親和的な著作権の立場を採用している。2018年、日本は著作権法を改正し、機械学習訓練を含む「著作物に表現された思想又は感情の享受を目的としない」使用は著作権侵害を構成しないことを明文化した。この改正により日本はAI訓練に最も友好的な法域の一つとなった。[17]
日本政府の政策文書はこの改革がAI分野における日本の国際競争力強化を目的としていることを明示している。他国がAI訓練における保護された素材の使用を認める一方で日本がそれを禁止すれば、日本のAI産業は競争上不利な立場に置かれることを日本は認識した。これは明確な「競争力志向型」の知的財産政策である。
日本のアプローチはプラグマティズムを体現している。「訓練は複製に該当するか」という教義的な法的議論に絡まるのではなく、政策目的から直接出発している——どのようなルールが日本の社会的厚生と国際競争力を最大化するか? この政策思考は他の国々にとって参考に値する。
EU:テキスト・データマイニング例外
EUは2019年のデジタル単一市場著作権指令において、「テキスト・データマイニング」(TDM)の著作権例外を設けた。この例外の下、学術研究機関は合法的にアクセスした素材に対し、機械学習訓練を含むテキスト・データマイニングを著作権侵害を構成することなく行うことができる。また商業組織も、著作権者が明示的にオプトアウトしない限りTDMを行うことができる。[18]
EUの「オプトアウト」メカニズムは創作者の権利とAI発展のバランスを取ろうとしている。理論上、著作権者がその作品をAI訓練に使用されたくない場合、技術的または法的手段でその意思を表明でき、AI開発者はその選好を尊重しなければならない。しかしこのメカニズムは実務上の課題に直面する——あるAI開発者が特定の著作物がオプトアウトしていたことを「知っていた」ことをどう証明するか? 数十億のデータポイントにわたって各データの許諾状況をどう追跡するか?[19]
米国:訴訟を通じた不確実性
米国の立場は現在最も不明確であり、司法手続きを通じて徐々に明確化されつつある。ニューヨーク・タイムズ対OpenAI、作家たちの集団訴訟、ゲッティ・イメージズ対Stability AIなどの訴訟において、裁判所がAI訓練がフェアユースに該当するかどうかを判断することになる。[20]
この「訴訟を通じた明確化」アプローチには長短がある。長所は、裁判所が画一的な立法ではなくケースバイケースで緻密な判断を下せること。短所は、確定的判決が出るまでの法的不確実性が投資とイノベーションを抑制すること。一部のAI開発者は法的リスクを理由に米国での投資を減らし、日本やより明確な法的環境を持つ他の地域に振り向ける可能性がある。
国際競争の観点からは、米国の法的不確実性はAI競争において不利な立場に置きかねない。もし裁判所が最終的にAI訓練は一般的に侵害を構成するとの判決を下せば、米国AI産業は大規模な訴訟とライセンス費用に直面する一方、他国の競合はそのような制約に直面しない。
五、国家競争力に関する重要な考察
AI時代の生産性革命
AIは蒸気機関、電気、インターネットに続く次の汎用技術(GPT)革命として広く認識されている。汎用技術の特徴は特定の産業だけでなく、経済全体の運営方法を変革することにある。蒸気機関は製造業、輸送、農業を変革した。電気は工場、家庭、都市を変革した。インターネットはコミュニケーション、商取引、エンターテインメントを変革した。AIは認知的労働に関わるあらゆる分野を変革するだろう。[21]
歴史的経験は、汎用技術革命において新技術をいち早く採用した国家が大きな競争優位を獲得することを示している。英国は蒸気機関の先駆的導入により19世紀を支配した。米国は早期の電化とインターネット導入により20世紀を支配した。AI時代において、AI技術を効果的に開発・導入できる国家が21世紀の経済競争において優位に立つだろう。[22]
知的財産制度はAI発展に影響を与える決定的な要因である。ある国の著作権制度がAI訓練を困難かつ高コストにするならば、その国のAI産業は他国に後れをとるだろう。これはAI産業自体の損失にとどまらず、経済全体の生産性向上の遅延を意味する。
旧来の思考に固執するコスト
伝統的な著作権の枠組みは印刷機とマスメディアの時代に設計されたものであり、複製が希少で、管理可能で、追跡可能であるという前提に基づいている。この枠組みの下では、「複製」そのものが規制の中核的対象と考えられている。しかしデジタル時代において複製はユビキタスなものとなった——ウェブページの閲覧は複製を伴い、コンピューターの使用は複製を伴い、機械学習は複製を伴う。著作権法が「複製」を中心概念として維持し続けるなら、現代のテクノロジーと根本的に両立しなくなるだろう。[23]
より根本的な問題は、伝統的な著作権の枠組みが創作を個人的、離散的、帰属可能なものと仮定していることだ。一冊の本には一人の著者がおり、一曲の歌には一人の作曲家がおり、著作権は個人に明確に帰属する。しかしAI訓練はこの仮定を打ち破る——AIの能力は数十億のソースの「集合的貢献」に由来し、単一のソースがAIの能力の「所有権」を主張することはできない。[24]
伝統的な著作権の枠組みをAI訓練に無理やり適用しようとすることは、馬車時代の法律で自動車を規制しようとするようなものだ。技術の発展を阻害するだけでなく、不合理な結果をもたらすだろう——例えば、AI開発者に数十億の「権利保有者」にマイクロライセンス料を支払わせるよう要求し、事実上AI開発を不可能にするような結果を。
創作者の真の利益
厳格な著作権保護を求める議論はしばしば「創作者の保護」というレトリックを援用する。しかし経済学的視点からは、こう問わなければならない——過保護は本当に創作者の利益になるのか?
第一に、ほとんどの創作者は著作権制度から受け取る対価が微々たるものである。音楽産業ではトップ1%のアーティストが収入の圧倒的大部分を稼ぐ。出版業ではベストセラー作家と平均的作家の所得格差は数千倍に及びうる。著作権制度の主な受益者は一握りのスーパースターと大手著作権保有企業(ディズニーやユニバーサル・ミュージックなど)であり、一般の創作者ではない。[25]
第二に、AIツール自体が創作者の生産性向上を助けうる。多くの作家、アーティスト、ミュージシャンがすでにAIを創作プロセスの支援に使用している。著作権制度がAI発展を阻害するなら、その犠牲者にはAI企業だけでなく、AIツールに依存する創作者も含まれる。
第三に、過度な著作権保護は創作者の「オーディエンス基盤」を害する可能性がある。AIツールがライセンス費用のために高額になれば、それらのツールを使用する企業や個人は減少する。これらの企業や個人は創作者の潜在的市場である。繁栄するAIエコシステムは創作者により多くの機会を生み出す可能性があり、減少させるのではない。
六、政策提言:未来のための著作権改革
提言1:AI訓練のフェアユースとしての位置づけを明確にする
各国は立法または司法判断を通じて、AI訓練が——複製ではなく学習の行為として——著作権の合理的例外の範囲に入ることを明確にすべきである。これは著作権を廃止することではなく、技術的現実と社会的ニーズに合致するよう著作権の境界を調整することを意味する。日本の2018年著作権法改正はその参考モデルを提供している。[26]
提言2:「訓練」と「出力」を区別する
法律はAI訓練プロセスとAI出力コンテンツを区別すべきである。訓練プロセスは変形的な学習行為として広く認められるべきである。しかし、特定のAI出力が保護された著作物と実質的に類似している場合、その出力は依然として侵害を構成しうる。この区別は技術的に実現可能であり、「表現」を保護し「アイデア」を保護しないという著作権の根本原則と一致する。
提言3:集団ライセンスと補償メカニズムの設立
創作者の権利について依然として懸念がある場合、集団ライセンスと補償メカニズムを検討しうる。音楽産業におけるASCAPやBMIのような組織と同様に、著作権者を代表してAI開発者と交渉し、得られた補償を創作者に分配する専門機関を設立することができる。このようなメカニズムはAI開発を阻害することなく、創作者に何らかの形の補償を提供しうる。[27]
ただし、このようなメカニズムは「反コモンズの悲劇」の別の形態にならないよう慎重に設計されなければならない。ライセンス料は合理的であるべきであり、交渉プロセスは簡素化されるべきである。さもなければ取引費用が依然としてAI開発を阻害するだろう。
提言4:著作権保護期間を短縮する
より根本的な改革は、著作権保護期間の再検討である。死後70年という期間は経済学的な正当性を持たず、純粋に著作権産業のロビイング(特にミッキーマウスを保護するためのディズニーの度重なるロビイング)の結果である。保護期間を15年から25年に短縮すれば、パブリックドメインに入る素材が劇的に増加し、AI訓練と人間の創作活動の双方に、より豊かなパブリックリソースを提供するだろう。[28]
結論:イノベーションと保護のバランスを求めて
知的財産制度は根本的に社会契約である——社会が創作者に一時的な独占権を付与する代わりに、継続的なイノベーションと最終的なパブリックドメインへの貢献を得る。この契約の条件は技術と社会の進化に応じて調整されるべきである。AI時代に印刷機時代に設計された著作権の枠組みに固執することは、自動車の時代に馬車の交通規則を主張するようなものだ——時代錯誤であるだけでなく有害である。
著作権の過保護のコストはAI発展の停滞、国家競争力の喪失、イノベーションの減速である。これらのコストは最終的にすべての社会——「保護」されているはずの創作者自身を含む——が負担する。AI技術を効果的に発展させられない国は21世紀の経済競争で後れをとる。そして停滞する経済は創作者に繁栄する市場を提供できない。
真の知恵は既存の権利を硬直的に保護することではなく、全体的な社会的厚生を促進する制度を設計することにある。これには「著作権は本質的に神聖である」という神話を放棄し、功利主義的な視点から再検討することが必要である——AI時代においてイノベーション、競争力、社会的厚生を最大化する知的財産制度はどのようなものか? この問いへの答えが、今後数十年にわたる国家の発展軌道を決定するだろう。
参考文献
- U.S. Constitution, Art. I, Sec. 8, Cl. 8. [Congress.gov]
- Fisher, W. (2001). Theories of intellectual property. In S. Munzer (Ed.), New Essays in the Legal and Political Theory of Property. Cambridge University Press. [Harvard]
- Coase, R. H. (1960). The problem of social cost. Journal of Law and Economics, 3, 1-44. [DOI]
- Landes, W. M., & Posner, R. A. (2003). The Economic Structure of Intellectual Property Law. Harvard University Press.
- Lessig, L. (2004). Free Culture. Penguin Press. [Free Culture]
- Pollock, R. (2009). Forever minus a day? Calculating optimal copyright term. Review of Economic Research on Copyright Issues, 6(1), 35-60. [SSRN]
- Heller, M. A. (1998). The tragedy of the anticommons. Harvard Law Review, 111(3), 621-688. [DOI]
- Lemley, M. A. (2021). How generative AI turns copyright upside down. Stanford Law Review Online. [Stanford Law Review]
- Shapiro, C. (2001). Navigating the patent thicket. Innovation Policy and the Economy, 1, 119-150. [DOI]
- Heller, M. A., & Eisenberg, R. S. (1998). Can patents deter innovation? Science, 280(5364), 698-701. [DOI]
- Vaswani, A., et al. (2017). Attention is all you need. NeurIPS, 30. [arXiv]
- Sobel, B. L. (2017). Artificial intelligence's fair use crisis. Columbia Journal of Law & the Arts, 41(1), 45-97. [DOI]
- 17 U.S.C. § 107. [Cornell Law]
- Samuelson, P. (2023). Generative AI meets copyright. Science, 381(6654), 158-161. [DOI]
- Sag, M. (2019). The new legal landscape for text mining and machine learning. Journal of the Copyright Society of the U.S.A., 66(3), 291-368. [SSRN]
- Grimmelmann, J. (2016). There's no such thing as a computer-authored work. Columbia Journal of Law & the Arts, 39(3), 403-416. [DOI]
- Japan Copyright Act, Article 30-4 (2018 Amendment). [e-Gov]
- Directive (EU) 2019/790, Articles 3-4. [EUR-Lex]
- Geiger, C., & Frosio, G. (2018). Text and data mining in the proposed Copyright Reform. IIC, 49(7), 814-844. [DOI]
- The New York Times Co. v. Microsoft Corp. et al., Case No. 1:23-cv-11195 (S.D.N.Y. 2023). [Complaint]
- Brynjolfsson, E., & McAfee, A. (2014). The Second Machine Age. W. W. Norton & Company.
- Acemoglu, D., & Restrepo, P. (2019). Automation and new tasks. Journal of Economic Perspectives, 33(2), 3-30. [DOI]
- Litman, J. (2001). Digital Copyright. Prometheus Books.
- Lee, P. (2024). Derivative AI works and the training data question. Yale Law Journal, 133(4).
- Krueger, A. B. (2019). Rockonomics. Currency.
- Ueno, T. (2021). The flexible copyright exception for 'non-enjoyment' purposes. Journal of Intellectual Property Law & Practice, 16(2), 111-122. [DOI]
- Ginsburg, J. C. (2018). Authors and users in copyright. Journal of the Copyright Society of the U.S.A., 45(1), 1-20.
- Boldrin, M., & Levine, D. K. (2008). Against Intellectual Monopoly. Cambridge University Press. [Online]