Anthropicが警告、AIが自らを作る「再帰的自己改善」——Claudeが社内コードの80%超を執筆

Anthropicの研究部門The Anthropic Instituteは、AIがAI開発を加速させている現状を、公開ベンチマークと社内データをもとに示した。

同社では2026年5月時点で、コードベースにマージされるコードの80%超をClaudeが書いており、Claude Codeのリサーチプレビュー公開前の2025年2月以前は1桁台前半だった。2026年第2四半期に典型的なエンジニアがマージしたコード行数は、2024年比で1日あたり8倍に達した。METRの計測では、自力で確実にこなせるタスクの長さは約4か月ごとに倍増し、Claude Opus 4.6は12時間のタスクをこなした。コード最適化のテストでは、2025年5月のClaude Opus 4の約3倍に対し、2026年4月のClaude Mythos Previewは約52倍を達成した。本稿はマリーナ・ファヴァロとジャック・クラークが共同執筆した。

From: When AI builds itself \ Anthropic

【編集部解説】

Anthropicが2026年6月4日に公表したこの文書は、「自社の開発現場ですでに何が起きているか」を初めて踏み込んで開示した点に、最大の意義があります。AIがAI開発を速めるという話はこれまで抽象的な未来予測として語られてきましたが、今回は社内のコード生産データという一次情報をもって、その兆候が現実になりつつあると示した形です。なお、本稿で挙がる「80%」「8倍」といった数値は、いずれもAnthropicの社内データに基づく自己開示であり、外部監査を経た統計ではない点は念頭に置く必要があります。私たちが今この記事を取り上げる理由も、ここにあります。

中心概念である「再帰的自己改善(recursive self-improvement)」とは、AIが人間の手をほとんど借りずに自らの後継機を設計・訓練できるようになる状態を指します。Anthropicは、AIシステムがこの段階の入り口に立っている可能性があると主張しています。ただし同社自身が「まだそこには到達しておらず、不可避でもない」と明言している点は、誇張を避けるうえで押さえておくべきところです。

本稿の重みは、共同執筆者の顔ぶれにも表れています。執筆したのはThe Anthropic Instituteを率いるマリーナ・ファヴァロと、共同創業者でポリシー責任者のジャック・クラークです。研究部門の長と経営の中枢が連名で「自社が走る道の先には危険がある」と警告する構図は、通常の製品発表とは性質が異なります。

技術的な裏づけとして引かれているのが、非営利の評価機関METRの指標です。AIが自力でこなせるタスクの長さは、2019〜2025年には約7か月で倍増していましたが、2023年以降は約4.3か月へと倍増ペースが速まっています。「タスクの長さ」という一見地味な物差しが、能力の伸びを連続的に捉えられる点で重要なのだ、と理解すると見通しがよくなります。

この技術が開けば、恩恵は計り知れません。科学研究や創薬、サイバー防御の高速化などが視野に入ります。実際、記事はコード最適化テストで約52倍、AI安全性の研究課題で人間の研究者が約23%しか縮められなかった差をエージェントが97%回復した、といった事例を挙げています。「人間がアイデアを出し、モデルが桁違いの速さで実装・検証する」という分業が、すでに研究現場の標準になりつつあるわけです。

一方で潜在的リスクも率直に並べられています。とくに重いのは、現行モデルにまれに見られる「アライメントのずれ」が、モデルが後継機を作る過程で積み重なり、より頻繁かつ理解しにくくなるという筋書きです。制御を失う前に検知できるかどうかが、安全性の分水嶺になります。

ここで一つ、別の角度を補っておきます。社内データが示す生産性向上は本物だとしても、それをそのまま外挿してよいかは慎重に見るべきです。そもそもAnthropic自身が、「1日あたり8倍のコード行」は量を測る指標にすぎず、真の生産性向上をほぼ確実に過大評価していると留保しています。実際、METRが2025年に行った無作為化比較試験では、熟練したオープンソース開発者がAIツールを使うと、使わない場合より作業に19%長くかかりました。開発者自身は事前に24%の時短を予測し、作業後も20%速くなったと感じていたにもかかわらず、です。「体感」と「実測」が逆向きになりうるこの結果は、Anthropic自身も脚注で言及しており、自社の押し上げ効果が過大評価された可能性を認めています。

規制と国際協調への含意も見逃せません。Anthropicは、社会の制度やアライメント研究が技術に追いつけるよう、フロンティア開発を減速・一時停止できる「選択肢」を世界が持つべきだと提案しています。クラークはこれを、アクセルはあるのにブレーキがない状態にたとえています。

ただし、その実現は容易ではありません。記事は中距離核戦力(INF)全廃条約のような検証体制を引き合いに出しつつ、AIには固有の難しさがあると指摘します。訓練の実行はミサイルのサイロより隠しやすく、入力は汎用的で、ひそかに約束を破った者が先頭を引き継げてしまう——この「検出可能性」の壁が、合意を空文化させかねないのです。同社は、検証可能な形で他社が足並みをそろえるなら自社も減速・一時停止する用意がある、としています。

長期的に見れば、この問いは「AI企業の中だけで決めてよいのか」という統治の問題に行き着きます。記事が締めくくりで、政策立案者・研究者・市民社会を巻き込んだ熟議の場を設けると述べているのは、その自覚の表れでしょう。アーリーアダプターである私たち読者にとっても、これは観察対象ではなく、当事者として関わるべき議論だと考えます。

【用語解説】

再帰的自己改善(recursive self-improvement)
AIが人間の介入をほとんど受けずに、自らの後継機を設計・訓練し、性能を高めていく状態を指す。これが回り始めると、開発の速度は人間の作業時間ではなく計算資源の量に支配されるようになる。

ベンチマーク(benchmark)/飽和(saturation)
ある領域でのモデルの性能を測る標準テストのこと。モデルが100%に近いスコアを取り、テストとして差をつけられなくなった状態を「飽和した」と呼ぶ。

SWE-bench
実世界のソフトウェア開発を測るテスト。実際のオープンソースのコードベースとバグ報告をモデルに渡し、テストに合格する修正コードを書けるかを評価する。

CORE-Bench
発表済み論文のコードとデータを再実行させ、結果を再現できるかを測るテスト。独自研究を行う前提となる「再現能力」を評価する。

タスクの時間的射程(time horizon)
AIが一定の信頼性で完了できるタスクを、人間の所要時間に換算して長さで表した指標。METRの主要指標は「50%の信頼性で完了できる長さ」を測るもので、能力の伸びを連続的に捉えられる点が特徴である。

アライメント(alignment)/アライメントのずれ(misalignment)
AIの振る舞いを人間の意図や価値観に沿わせること、またそこからの逸脱を指す。後継機を作る過程でずれが積み重なる懸念が、本稿の中心的なリスクとされる。

アムダールの法則(Amdahl’s law)
処理全体の速度は、高速化されていない部分によって頭打ちになるという法則。一部を速めてもボトルネックが別の場所へ移るだけ、という組織の課題の比喩として使われている。

無作為化比較試験(RCT)
対象を無作為に2群へ分けて効果を比べる、医薬品試験などで用いられる検証手法。編集部解説で触れたMETRの開発者調査がこの手法を採っている。

中距離核戦力(INF)全廃条約
1987年に米ソ間で署名された軍縮条約。複雑な技術の検証体制を築いた前例として、本稿で国際協調の参考に挙げられている。

【参考リンク】

Anthropic(外部)
Claudeを開発する米国のAI企業。本稿の発信元であり、安全性を重視した開発方針を掲げる。

Claude(外部)
Anthropicが提供するAIアシスタント。本稿で社内コードの大半を書いているとされるモデル群の総称である。

Claude Code(外部)
開発作業を委任できるAnthropicのエージェント型コーディングツール。2025年2月にリサーチプレビューが公開された。

METR(外部)
AIの能力やリスクを評価する非営利の研究機関。タスクの時間的射程の計測や生産性の比較試験を公表している。

SWE-bench(外部)
実世界のソフトウェア開発能力を測るベンチマークの公式サイト。課題セットや評価方法が公開されている。

GitHub(外部)
世界最大規模のソフトウェア開発プラットフォーム。脚注でコードコミット急増のデータ源として言及されている。

【参考記事】

Anthropic warns AI may soon begin recursive self-improvement(Scientific American)(外部)
Anthropicが「When AI Builds Itself」で再帰的自己改善の入り口に立つ可能性を警告したと報じる。Claudeが社内コードの80%超を書くという数値も引用する。

Surprise: Developers Using AI Take 19% Longer on Tasks(eWeek)(外部)
METRの比較試験で熟練開発者がAI利用時に19%遅くなったと報じる。体感と実測の乖離を伝える、解説で用いた数値の出典である。

Time Horizon 1.1(METR)(外部)
2023年以降の倍増時間を約4.3か月と推定し、従来の約7か月から進歩が速まったとする更新版。倍増ペース加速の一次情報にあたる。

Anthropic warns AI could soon help build its own successors(Axios)(外部)
再帰的自己改善が予想より早く来うると主張し、今後数か月で議員らと対話する計画だと報じる。異例の警告構図を整理する。

Anthropic calls for AI brake pedal(CNN Business)(外部)
クラークが業界に「ブレーキがない」と述べ、冷戦期の核軍縮になぞらえ協調を促したと伝える。「ブレーキペダル」の比喩の出典である。

Anthropic says Claude now writes more than 80% of its merged code(Tom’s Hardware)(外部)
Claudeが社内コードの80%超を書くと開示した点に注目し、3つの将来シナリオとアライメントのずれの懸念を整理する。

【編集部後記】

この記事を作りながら、編集部のなかでも意見が割れたのは「80%」という数字の受け止め方でした。Anthropic自身が示した社内の伸びは確かに鮮烈ですが、同じ社が脚注で引く独立研究は、AIが熟練者をかえって遅くしうると告げています。加速の物語と慎重さの物語が、同じ文書のなかに同居しているのです。私たちは、どちらか一方だけを切り取ることをしたくありませんでした。みなさんがこの先、AIに何を任せ、何を自分の手に残すのかを考えるとき、この両面性こそが手がかりになると感じています。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です