Claude Fable 5登場、Anthropicが「危険すぎるAI」Mythosを一般公開|9時間半の自律作業が変える働き方

Anthropicが2026年6月、新たなフロンティアモデル「Claude Fable 5」を公開しました。

同社は4月に最上位の「Mythos」クラスを開示しており、Fable 5をこのクラスで「一般利用に対して安全」なモデルと位置づけています。あわせて、制限を一部解除した「Mythos 5」をProject Glasswingのメンバーへ提供します。Stripeは5000万行のRubyコードベースの移行を1日で実行したと報じられ、Fable 5はビジョンのみのハーネスでPokémon FireRedを完遂しました。ウォートン校教授のイーサン・マスク──ではなくイーサン・モリックは、19ページの仕様書を与えたところFableが9時間半作業し分析ツールを生成したと述べています。サイバーセキュリティ、生物・化学、蒸留に関するクエリはOpus 4.8へリダイレクトされ、発生は5%未満とされます。API課金は入力100万トークンあたり10ドル、出力50ドルで、Opus 4.8の2倍です。Pro、Max、Team、Enterpriseの加入者は6月22日まで無償アクセスを得ます。

From: Claude Fable 5 brings Mythos to the masses — Anthropic’s new frontier model is ‘state-of-the-art on nearly all tested benchmarks’

【編集部解説】

なぜ今、私たちがこのニュースを取り上げるのか。それは、Anthropicが「危険すぎて世に出せない」と判断していた能力クラスのモデルを、ついに一般ユーザーへ開放したという、AI普及史の節目だからです。技術の進歩そのものよりも、「いつ、どこまで、誰に渡すか」という配り方が問われる時代に入ったことを、この一件は象徴しています。

まず整理しておきたいのは、今回登場したのが2つのモデルだという点です。広く使えるClaude Fable 5と、能力制限を一部解除したClaude Mythos 5。両者は中身(基盤モデル)が同一で、違いは「安全装置(セーフガード)」の有無だけです。Fableという名前はラテン語のfabula(語られるもの)に由来し、Mythos(神話)と対になるよう名付けられたとAnthropicは説明しています。同じエンジンに鍵をかけたものがFable、外したものがMythos、と捉えると理解しやすいでしょう。

この「中身は同じ、鍵だけ違う」という設計こそ、今回の核心です。従来、危険な用途を防ぐ手段は「危ない質問を拒否する」ことでした。けれどもAnthropicが選んだのは、サイバーセキュリティ・生物化学・蒸留(distillation)に関わる要求を検知すると、前世代のOpus 4.8に自動的に回答を引き継がせる方式です。露骨な拒絶ではなく「格落ちした別モデルが代わりに答える」という体験に置き換えたわけです。Anthropicは、こうした切り替えがセッションの5%未満でしか起きず、95%超のセッションではFable 5がMythos 5と実質同等の性能を発揮すると説明しています。

ここで参照元Tom’s Hardwareの記述に1点補足が必要です。同記事は能力抑制の対象として「AI・ML研究」を挙げていますが、Anthropic公式が明示しているフォールバック領域は「サイバーセキュリティ」「生物・化学」「蒸留」の3つです。蒸留とは、強力なモデルの出力を大量に取り出して別の競合モデルを訓練する行為を指し、Anthropicはこれを近接フロンティア能力が無防備に拡散する経路として警戒しています。なお複数の海外報道もフォールバックが作動するのはこの3領域だと一致して報じており、Tom’s Hardwareの「AI・ML研究」という表現は、モデルカード上の能力抑制に関する記述を広めに解釈したものと見られます。「AI研究そのものを一律に抑える」というより「自社能力の流出(蒸留)を抑える」と理解するのが、一次情報に即した読み方です。

では、この鍵のかかったモデルで何ができるのか。象徴的なのが「長時間の自律作業」です。Stripeは5000万行のRubyコードベースの全面移行を1日で完了したと報告しており、手作業ならチームで2か月超かかる規模でした。ウォートン校のイーサン・モリックは19ページの仕様書を渡したところ、モデルが9時間半にわたり人の介入なしで分析ツールを作り上げたと記しています。彼はこの体験を「人間が呪文を唱える者から、依頼するクライアントへ変わった」と表現しました。指示を細かく与える対象ではなく、丸ごと任せる相手へ。人とAIの関係性が変質しつつあるという指摘です。

ポジティブな射程は広大です。研究現場では、Mythos 5がタンパク質設計の一部工程を約10倍に加速し、遺伝子治療に使われるAAV(アデノ随伴ウイルス)の設計課題で専用モデルを上回ったと報告されています。創薬や基礎科学を前進させる力は本物でしょう。一方で、まさにその同じ能力が「悪意ある者の手に渡れば危険なウイルス設計にも使える」というのが、Anthropicが生物・化学領域に鍵をかけた理由です。善用と悪用が同じ操作の表裏(デュアルユース)であること、これがこのモデルの本質的な難しさを物語っています。

潜在的なリスクと使い勝手の代償も見ておきましょう。モリックは安全装置が「セキュリティ問題のごくかすかな兆候」でも作動すると述べ、善意の開発者が自分のコードを守るためにすらFable 5を使えないと指摘しています。Anthropic自身も、誤検知(false positive)が理想より多いことを認め、今後縮小していくとしています。さらに見落とせないのが、Mythosクラスでは業務トラフィックに30日間のデータ保持が義務づけられる点です。学習には使わないとされていますが、機微な情報を扱う企業にとって導入のハードルになり得ます。

規制と地政学への含意も大きいテーマです。Anthropicはこのリリースの直前、フロンティアAI開発に「協調的なブレーキ」を設けるよう主要ラボへ呼びかけていました。危険性を訴えながら強力なモデルを出すという一見矛盾した動きは、「能力を全開放も全拒否もせず、領域ごとに振り分ける」という第3の道を業界標準として示す試みとも読めます。複数の報道では、Mythosクラスが各OSやブラウザに1万件超の重大脆弱性を発見した一方、修正済みは14%にとどまるという指摘もあり、防御側の体制整備が追いついていない現実も浮かびます。

最後に、長期的な視点です。価格は入力100万トークンあたり10ドル、出力50ドルで、Opus 4.8の2倍。Anthropicはこれを限定提供だったMythos Preview(約30ドル/150ドルとされる)の半額未満だと位置づけています。日常的な軽作業では割高で、真価を発揮するのは数時間〜数日に及ぶ複雑なタスクです。つまりFable 5は「速く安く答えるAI」ではなく「長く粘り強く働くAI」へと役割が移りつつあることを示しています。私たちinnovaTopiaの読者にとって重要なのは、性能の数字以上に、この「AIに何時間も仕事を委ねられる時代」が、人間の創造性や責任の所在をどう書き換えていくのか、という問いでしょう。便利さと不気味さが同居するこの瞬間を、未来を報じる立場として丁寧に見届けていきます。

【用語解説】

Mythosクラス(Mythos-class)
Anthropicの Claudeモデル群のうち、従来最上位だったOpusクラスをさらに上回る能力帯を指す呼称である。最初のMythos Previewが4月に登場し、今回Fable 5とMythos 5が続いた。

フォールバック(fallback)
Fable 5が機微なトピックの要求を検知した際、自らは答えず前世代のOpus 4.8に回答を引き継がせる仕組みである。露骨な拒否ではなく、性能を一段落とした別モデルが代替応答する点が特徴だ。

蒸留(distillation)
強力なAIモデルの出力を大量に取り出し、それを教材として別の競合モデルを訓練する手法である。Anthropicは自社能力が無防備なまま流出・拡散する経路として警戒し、フォールバック対象に含めている。

デュアルユース(dual-use)
同一の能力が、善用にも悪用にもなり得る性質を指す。創薬研究を助ける推論が、危険なウイルス設計にも転用され得る、という両義性が今回の安全設計の前提になっている。

セーフガード/分類器(classifier)
本体モデルとは別に動き、悪用や脱獄(ジェイルブレイク)の試みを検知して応答を遮断・切り替える補助的なAIシステムである。FableとMythosの違いは、この鍵の有無のみだ。

誤検知(false positive)
本来は無害な要求を、安全装置が危険と誤って判定してしまうことである。Anthropicは安全側に厳しく調整した結果、誤検知が理想より多いことを認めている。

AAV(アデノ随伴ウイルス)
遺伝子治療で目的の遺伝子を体内へ運ぶ「運び屋」として使われるウイルスである。治療に有用な一方、同じ設計能力が危険なウイルス作成にも応用され得る代表例として記事に登場する。

トークン(token)
AIが文章を処理する際の最小単位で、課金や処理量の基準となる。Fable 5の価格は入力100万トークンあたり10ドル、出力100万トークンあたり50ドルで提示されている。

Project Glasswing
Anthropicがサイバー防御者や重要インフラ提供者など、信頼できる組織に限定してMythosクラスを提供する取り組みである。制限を一部解除したMythos 5はここを通じて配布される。

【参考リンク】

Claude Fable 5 and Claude Mythos 5(Anthropic公式発表)(外部)
能力評価、安全装置の設計思想、価格、提供スケジュールを記した一次情報の発表ページ。

Project Glasswing(Anthropic)(外部)
Mythosクラスを信頼できる組織へ限定提供する取り組み。Mythos 5の提供枠組みにあたる。

Claude(公式サービス)(外部)
Fable 5を含むClaudeモデルを利用できる公式サービス。Pro・Max・Teamなどのプランで使える。

Stripe(外部)
オンライン決済インフラの提供企業。5000万行のRuby移行を1日に圧縮した事例として登場する。

Ethan Mollick / One Useful Thing(外部)
9時間半の自律作業などFableの使用感を綴った、モリック教授による実体験エッセイ。

Dyno Therapeutics(外部)
AAVを用いた遺伝子治療の運搬体を設計する企業。Mythos 5の生物領域評価の候補を開発した。

【参考記事】

Claude Fable 5 and Claude Mythos 5(Anthropic公式ブログ)(外部)
フォールバックは5%未満、価格は入力10ドル/出力50ドルと明記した一次情報。主要数値の根拠。

Claude Fable 5 and Mythos 5: Pricing, API Costs, and Benchmark Comparison(finout)(外部)
旧Mythos Previewが約30ドル/150ドルだったと示し、「半額未満」を数値で裏付ける記事。

Anthropic’s Claude Fable 5 can work on your project for nine hours straight(gagadget)(外部)
9時間半の自律作業や価格・無償期間を整理し、コスト効率の最適点を分析した記事。

Claude Fable 5 launches as Anthropic’s first public Mythos-class model(daily.dev)(外部)
1万件超の脆弱性発見と修正済み14%、15か国・約200組織への拡大を伝える記事。

Anthropic releases Claude Fable, a version of Mythos(TechCrunch)(外部)
「協調的ブレーキ」提言やRSI懸念など、リリース直前の文脈を整理した記事。

Anthropic brings Mythos to the masses with Claude Fable 5(VentureBeat)(外部)
同一基盤で安全装置の有無のみが異なる構造と、3分類器の意味を解説した記事。

【編集部後記】

「世界は終わらなかった」──Tom’s Hardwareの結びの一文が、妙に頭に残ります。かつて封印されていた能力が、鍵をかけ直された形で私たちの手元に届く。その鍵が時に善意の人さえ締め出してしまう不器用さも含めて、これは新しい技術の配り方をめぐる、壮大な社会実験の入口なのかもしれません。私たちは何かを教える立場にはありませんが、この手探りの面白さと怖さを、読者のみなさんと同じ目線で味わっていきたいと思っています。みなさんがもしFable 5に触れる機会があれば、その「便利さ」と「少しの不気味さ」を、ぜひ自分の感覚で確かめてみてください。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です