2025年1月20日――ドナルド・トランプが第47代米国大統領に就任したまさにその日、中国のAI企業が静かにリリースしたモデルが、数日のうちに世界の資本市場を揺るがすことになる。DeepSeekのDeepSeek-R1は、数学的推論、プログラミング、科学的問題解決のベンチマークにおいてOpenAIのo1モデルに匹敵または上回る性能を示した。にもかかわらず、報告された訓練コストはわずか約557万ドルであり、米国の同等モデルに投じられた数億ドルのごく一部に過ぎなかった。[1] 1月27日、米国株式市場は激しい動揺を経験した。NVIDIAは一日で約5,930億ドルの時価総額を失い、米国株式市場史上、単一企業として過去最大の一日当たり損失を記録した。[2] 「DeepSeekモーメント」と呼ばれたこの出来事は、不穏な真実を明らかにした。2022年10月以降、中国の先進AI計算能力へのアクセスを制限するために米国が実施してきた一連の半導体輸出規制が、中国のAI開発を抑制する上で意図したほど効果的でなかった可能性があるということだ。もし中国がより少ない計算資源とより低いコストで米国のトップラボに匹敵するモデルを訓練できるのであれば、AIチップをめぐる地政学的な競争の戦略的前提そのものが再検討される必要がある。本稿は、地政学的ゲーム理論、オープンソース経済学、技術主権の三つの次元から、世界のAI地図を再編しているこの構造的変革を分析する。
I. DeepSeekの技術を解剖する:アルゴリズムのイノベーションがいかにハードウェアの限界を「回避」するか
DeepSeek現象の地政学的含意を理解するには、まずその技術的成果の本質を把握しなければならない。DeepSeek-V3(R1の基盤モデル)は6,710億パラメータのMixture of Experts(MoE)モデルだが、各推論時に活性化されるのはわずか370億パラメータに過ぎない。つまり、実際の計算要件は公称パラメータ数が示唆するものをはるかに下回る。[3]
DeepSeekの中核的技術イノベーションは三つの領域に集中している。第一に、Multi-head Latent Attention(MLA)である。注意機構のキー・バリューペアを低次元の潜在空間に圧縮することで、推論時のメモリ要件と計算コストを大幅に削減する。従来のMulti-Head Attention機構はTransformerアーキテクチャの中核的ボトルネックの一つであり、MLAはエレガントな数学的手法によってモデル性能を維持しながらこのボトルネックを大幅に緩和した。[3]
第二に、補助損失なし負荷分散(Auxiliary-loss-free Load Balancing)である。MoEモデルにおいて、異なるエキスパート間のワークロード均等配分は長年のエンジニアリング課題であった。従来の方法は補助損失関数を用いて不均衡な配分にペナルティを課していたが、これはモデルの最終性能を犠牲にしていた。DeepSeekはバイアス項に基づく動的調整メカニズムを提案し、モデル品質を損なうことなく負荷分散を達成した。[3]
第三に、戦略的に最も重要なのがFP8混合精度訓練フレームワークである。米国の輸出規制下で、DeepSeekはNVIDIA H800 GPU(中国向け輸出規制準拠版、相互接続帯域幅が400 GB/sに制限されている)を使用したと報じられている。[4] FP8(8ビット浮動小数点)混合精度訓練フレームワークを開発することにより、訓練の浮動小数点精度を業界標準のBF16(16ビット)からFP8に下げ、各GPUの実効計算能力をほぼ倍増させた。これは「計算制限」の算定を根本的に変えるものである。
V3を基盤として、DeepSeek-R1は大規模強化学習(RL)をさらに組み込み、モデルがChain of Thought的な推論能力を発達させることを可能にした。単に答えを提供するだけでなく、その推論過程を示すのである。[1] 最も注目すべきは、DeepSeek-R1-Zeroの実験であった。人間が注釈を付けた教師あり微調整データを一切使用せず、純粋な強化学習のみで、モデルが「自発的に」推論行動を発達させることを研究者たちは発見した。この発見は、推論能力は慎重に設計された訓練データを通じてモデルに「教え込む」必要があるというAI研究における支配的な仮定に挑戦するものである。
II. 「コストショック」の実態と虚構:ナラティブ支配をめぐる戦い
DeepSeekが公表した557万ドルという訓練コストは、世界のメディア報道の焦点となった。しかし、この数字は慎重な解釈を要する。
第一に、557万ドルはV3の最終訓練フェーズにおけるGPUレンタルコストのみを計上したものである(2,048基のH800 GPU、14.8兆トレーニングトークン、約2ヶ月の訓練期間に基づく)。[3] これには含まれていないのは、予備研究と実験のコスト、データ収集・処理コスト、人件費、複数回の失敗した訓練実験、そしてR1フェーズの強化学習訓練コストである。一部のアナリストは、これらの間接コストを含めると、DeepSeek-R1の完全なライフサイクル開発コストは3,000万ドルから1億ドルに達する可能性があると推定している。これはOpenAIやGoogleの同等モデルよりはるかに低いが、センセーショナルに報じられた「557万ドル」の見出しをはるかに上回る。[5]
第二に、報告によれば、DeepSeekの親会社である幻方量化(High-Flyer Capital Management)は、米国の輸出規制が発効する前に10,000基以上のNVIDIA A100 GPUを調達した可能性がある。[6] これらのハイエンドGPUが研究段階の実験においてどのような役割を果たしたかは、外部からは分からない。要するに、「557万ドル」は包括的なコスト会計というよりも、巧みにフレーミングされたマーケティング数字である。
しかしながら、これらの修正を考慮しても、DeepSeekの成果は構造的な重要性を持つ。それは重要な命題を証明している。アルゴリズム効率の改善は、ハードウェアの力業によるスケーリングを部分的に代替できる。例えを使えば、米国のAI戦略は軍拡競争において敵対者の鉄鋼供給を管理し、造船能力を制限しようとするものに似ている。DeepSeekの対応は――我々はより大きな船ではなく、より優れた船を必要としている、というものだ。[7]
この命題の政策的含意は深遠である。Epoch AI研究所の分析が指摘するように、過去2年間でトップレベルモデルの訓練計算効率は年間約2〜3倍改善している。つまり、同じモデル性能に必要な計算資源は毎年半分から3分の1に減少しているのである。[8] この傾向が続けば、輸出規制が提供できる「機会の窓」は縮小し続けるだろう。
III. オープンソースAIの地政学的経済学:多次元のゲーム
DeepSeekがMITライセンスの下でモデルの重みをオープンソース化する決定には、複雑なゲーム理論的考慮が伴っている。
経済学の観点から、オープンソース化は「プラットフォーム戦略」である。無料の基盤モデルを提供することでエコシステムの粘着性を構築し、APIサービスやエンタープライズカスタマイズといった派生市場を通じて収益化する。MetaのLlamaシリーズはこのモデルの実行可能性を証明した。2024年にLlama 3.1がリリースされた後、世界で最も広く使用されるオープンソースLLMに急速に成長し、MetaはAI開発者コミュニティにおいて強力なブランドエクイティとエコシステム支配力を確立することができた。[9]
しかし、中国のAI企業によるオープンソースの決定には、追加の地政学的次元がある。米国のチップ輸出規制がエスカレートする中、中国のAI企業は囚人のジレンマに直面している。モデルをクローズドソースに保てば国内市場に閉じ込められ、グローバルなAI標準の形成に参加できない。オープンソースにすれば、世界的な広範な普及を通じてAI開発の技術的軌道に影響を与えることができ、同時に輸出規制の効果をさらに希薄化させる。なぜなら、モデルの重みが公開されれば、誰でもあらゆるハードウェアで推論や微調整を行えるからだ。[10]
DeepSeekのオープンソース戦略は、一種の「技術外交」として理解できる。高品質の無料モデルを提供することでグローバルな依存関係を構築し、それによって国際的なAIガバナンスへの影響力をめぐる競争においてレバレッジを獲得するのである。これは冷戦期にソ連が技術援助を通じて地政学的影響力を拡大した論理と類似しているが、デジタル時代においてはそのような影響の伝播速度は指数関数的である。
現在のグローバルなオープンソースAIエコシステムは四極構造を形成している。米国のMeta(Llamaシリーズ)、フランスのMistral、中国のDeepSeek/Alibaba Cloud Qwen、そして世界の学術機関が主導するコミュニティモデル(BigScienceのBLOOMなど)である。[11] 各極はオープンソース化の異なる動機を持つ。MetaはOpenAIやGoogleのクローズドソース独占に対抗することを目指し、Mistralは欧州の技術主権の志向を代表し、DeepSeekは商業拡大と地政学的考慮を組み合わせ、コミュニティモデルはAI民主化に対する学術界の理想主義を体現している。この多極構造は、オープンソースAIがもはや純粋に技術的な運動ではなく、大国間技術競争の新たな戦場となったことを意味する。
IV. 米国の戦略的ジレンマ:チップ規制の「メビウスの輪」
DeepSeekの台頭は、米国のAIチップ輸出規制政策の構造的矛盾を露呈させた。
2022年10月に米国商務省産業安全保障局(BIS)が中国向けの先進コンピューティング輸出規制の第一弾を発出して以来、[4] 米国は複数回の「修正パッチ」を行ってきた。NVIDIA H100の中国向け販売を制限した後、中国は準拠版のH800とA800に移行した。BISがさらに基準を厳格化すると、Huaweiは国産のAscend 910Bチップを投入した。そしてDeepSeekのアルゴリズムイノベーションは、「計算能力の制限はAI能力の制限に等しい」という前提そのものに根本的に挑戦した。
これは政策の「メビウスの輪」を生み出す。規制は被規制者の自主イノベーションを刺激し、自主イノベーションは規制の効果を弱体化させ、それが規制者にさらなる規制強化を促す。そしてこのサイクルが繰り返される。[12] さらに注目すべきは、規制強化の各ラウンドには重大な付随被害が伴うことである。NVIDIAは中国市場の喪失による財務的圧力に直面している(かつてデータセンター収益の25%を占めていた)。同盟国(オランダのASMLや日本の東京エレクトロンなど)は、規制への準拠を求められることによる商業的損失と外交的摩擦に直面している。[13]
2025年1月に就任したトランプ政権の政策の方向性は、不確実性をさらに高めている。一方では、トランプはバイデン政権のAI大統領令を撤回し、「AI規制緩和」のシグナルを発している。他方、彼の対中政策チームはより攻撃的な技術的デカップリングに傾いている。[14] この「国内は緩和、対外は強硬」の組み合わせは、パラドキシカルな結果をもたらす可能性がある。米国企業はより寛容な国内環境の中でイノベーションを加速する一方、より厳しい輸出規制が中国の自主代替をさらに刺激し、最終的にAI技術のグローバルな拡散を遅らせるどころか加速させる可能性がある。
V. オープンソースAIの両刃の剣:民主化の約束とリスク
オープンソースAIモデルの普及は、二つのレベルで別々に評価すべき影響を生み出す。
ポジティブな側面として、オープンソースAIはAI開発の障壁を実質的に引き下げている。Hugging Faceの統計によれば、2025年末までにプラットフォームは100万以上のモデルをホストし、月間500万以上のアクティブ開発者を擁するようになった。[15] オープンソースモデルにより、中小企業、学術機関、さらには個人開発者がテック大手のAPIに依存することなく独自のAIアプリケーションを構築できるようになった。これは特に発展途上国にとって重要である。OpenAIやGoogleのエンタープライズレベルの価格を支払えない可能性があるが、オープンソースモデルに基づいてローカルに最適化されたアプリケーションを構築できるからだ。ある意味で、オープンソースAIは技術民主化の力であり、「最も裕福な国と最大の企業のみがAI革命に参加できる」という権力構造に挑戦している。
リスクの側面として、オープンソースモデルはリリースされた後は「リコール」できない。誰でもダウンロード、改変し、安全ガードレールを除去できるのである。Metaの内部流出したLlamaの初期バージョンは、リリース後数日以内に安全制限が除去された。[16] これは深刻なセキュリティ懸念を引き起こす。オープンソースの推論モデルは、生物兵器設計の加速、サイバー攻撃ツールの開発、大規模な偽情報生成に使用される可能性はないか? これは仮定上のリスクではない。RAND Corporationの分析によれば、現在のオープンソースLLMは既に、基礎的知識を持つ個人に対して、特に化学と生物学の知識習得において重大な「能力向上」を提供できる。[17]
EU AI法(AI Act)はこの二つの次元のバランスを取ろうとしている。同法第2条は「無料かつオープンソース」のAIモデルに部分的な免除を規定している。モデルがオープンライセンスの下でリリースされ、商業AIシステムの一部として展開されていない場合、特定のコンプライアンス義務が免除される可能性がある。ただし、「システミックリスク」をもたらすオープンソースモデルは関連要件を遵守する必要がある。[18] この妥協は根本的なガバナンスのジレンマを反映している。オープンソースはグローバルな公共財であるが、グローバルな公共財のガバナンスにはグローバルな調整メカニズムが必要であり、現在の地政学的環境においてそのような調整メカニズムの確立はほぼ不可能である。
VI. 台湾の戦略的機会:オープンソースエコシステムにおけるポジショニング
グローバルなオープンソースAIエコシステムにおける台湾の役割は、そのユニークな産業構造を踏まえて考察する必要がある。
第一の次元:ハードウェアインフラ。オープンソースAIの普及は先進チップへの需要を減少させるわけではない。むしろ、需要を増加させる可能性がある。より多くの組織や個人がオープンソースモデルを推論や微調整に使用するにつれ、AIの推論チップに対するグローバルな需要はさらに拡大するだろう。TSMCの先進プロセスノード(3nm、2nm)と先進パッケージング技術(CoWoS)は、当面の間、グローバルAIハードウェアサプライチェーンにおいて最も代替不可能なリンクであり続ける。[19] DeepSeekの成功は「良いチップが不要」の証明ではなく、「良いチップをより賢く使う必要がある」ことの証明である。これは実際に台湾のチップ製造の価値を強化する。効率重視の訓練手法は、チップ品質に対してより低い要求ではなく、より高い要求を突きつけるからである。
第二の次元:繁体字中国語AIエコシステム。現在、主流のオープンソースLLMは一般的に、繁体字中国語において英語や簡体字中国語と比較して性能が劣る。[20] これは台湾にとって独自の機会の窓を開く。オープンソースの基盤モデルに基づき、繁体字中国語、台湾の法制度、台湾の産業用語に特化した微調整を行い、台湾市場(およびグローバルな繁体字中国語ユーザー)向けの垂直モデルを構築するのである。国家科学技術委員会のTAIDEプロジェクトはこの方向での第一歩を踏み出したが、より大きな産業参加とより持続的な投資が必要である。
第三の次元:「信頼される第三者」としての役割。米中の技術的デカップリングが激化する中、多くの国や企業は米国または中国のいずれかのAIエコシステムに完全に依存することを躊躇している。台湾は――成熟した民主主義国家であり、強力な技術力を持ち、信頼性の高い知的財産保護を備え、「政治の風向きでルールが変わらない」制度的安定性を有する――グローバルAIサプライチェーンにおける「信頼される第三者」となる潜在力を持つ。これは米国や中国のポジションを代替することではなく、両者の間に安全な「第三の道」を提供することである。
もちろん、この戦略的ポジショニングには制度的支援が必要である。台湾はAIガバナンス、越境データ移転、知的財産保護において国際基準に整合した制度的枠組みを確立する必要がある。これは単なるコンプライアンスのためではなく、国際的信頼を構築するための基盤としてである。
VII. 結論:計算力競争からインテリジェンス競争へ
DeepSeek現象が明らかにした最も根本的な洞察はおそらくこれである。AI競争の本質は「計算力競争」から「インテリジェンス競争」へとシフトしている。誰が最も多くのGPUを積み上げるかではなく、誰が限られたリソースを最もインテリジェントに使うかが問われているのである。このシフトがグローバルなAI情勢に与える影響は構造的なものだ。
米国にとってこれは、輸出規制は短期的には戦略的価値を保持するが、AIのリーダーシップを維持するための唯一のまたは主要なツールとしては機能し得ないことを意味する。真の堀は、基礎研究の深さ、人材エコシステムの豊かさ、そして制度環境の開放性にある。[21]
中国にとって、DeepSeekの成功は短期的な自信の向上であるが、新たな課題ももたらす。オープンソースのコミットメントと国家安全保障の考慮をいかに均衡させるか。アルゴリズムイノベーションのリーダーシップにおけるモメンタムをいかに維持するか。そしてDeepSeekの成功が引き起こす可能性のある輸出規制の強化にいかに対応するか。
台湾にとって、DeepSeekモーメントは明確な警鐘である。台湾のAI戦略は「世界のためにAIチップを製造する」というポジショニングに留まり続けることはできない。アルゴリズム効率が急速に向上する中、台湾はソフトウェアエコシステム(繁体字中国語モデル、アプリケーション層)と制度アーキテクチャ(AIガバナンス、データ規制)の両面で深みを同時に構築し、グローバルAIサプライチェーンにおける長期的な代替不可能性を確保しなければならない。
オープンソースAIの地政学は進行中のゲームであり、最終均衡は存在しない。あるのは絶えず進化する戦略的相互作用のみである。このゲームにおいて、勝者は最も強力なプレイヤーではなく、最も適応力のあるプレイヤーである。
参考文献
- DeepSeek-AI. (2025). DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning. arXiv:2501.12948
- Reuters. (2025). Nvidia loses nearly $600 billion in market value amid DeepSeek shock. reuters.com
- DeepSeek-AI. (2024). DeepSeek-V3 Technical Report. arXiv:2412.19437
- U.S. Department of Commerce, Bureau of Industry and Security. (2022). Implementation of Additional Export Controls: Certain Advanced Computing and Semiconductor Manufacturing Items. 87 FR 62186. Federal Register
- SemiAnalysis. (2025). DeepSeek: The Real Cost Behind the Headlines. semianalysis.com
- Financial Times. (2025). DeepSeek: the Chinese AI group that shook the world. ft.com
- Ding, J. (2025). DeepSeek and the Limits of Export Controls. ChinaTalk. chinatalk.media
- Epoch AI. (2025). Trends in AI Training Compute Efficiency. epochai.org
- Meta AI. (2024). Introducing Llama 3.1: Our most capable openly available model. ai.meta.com
- Hwang, T. (2025). Open Source AI and National Security. Center for Security and Emerging Technology (CSET). georgetown.edu
- Bommasani, R. et al. (2023). On the Opportunities and Risks of Foundation Models. Stanford CRFM. arXiv:2108.07258
- Allen, G. C. (2025). China's New AI Capabilities and the Failure of Export Controls. Center for Strategic and International Studies. csis.org
- Miller, C. (2022). Chip War: The Fight for the World's Most Critical Technology. New York: Scribner.
- The White House. (2025). Executive Order: Removing Barriers to American Leadership in Artificial Intelligence. whitehouse.gov
- Hugging Face. (2025). The State of Open Source AI 2025. huggingface.co
- Seger, E. et al. (2023). Open-Sourcing Highly Capable Foundation Models. Centre for the Governance of AI. governance.ai
- Mouton, C. et al. (2024). The Operational Risks of AI in Large-Scale Biological Attacks. RAND Corporation. rand.org
- European Parliament and Council. (2024). Regulation (EU) 2024/1689 — Artificial Intelligence Act, Article 2. eur-lex.europa.eu
- Taiwan Semiconductor Manufacturing Company. (2025). 2025 Annual Report. tsmc.com
- National Science and Technology Council. (2025). TAIDE: Trustworthy AI Dialogue Engine Project. taide.tw
- Amodei, D. (2025). On DeepSeek and Export Controls. Anthropic Blog. anthropic.com