新しいAIモデルが出るたびに、正直「またか」と思う気持ちと「今度こそ何か変わるかも」という期待が、半分ずつ自分の中に湧いてきます。今回のClaude Fable 5は、その期待のほうがだいぶ勝っているモデルかもしれません。
2026年6月9日、AnthropicがClaude Fable 5を発表しました。一般に使えるClaudeとしては過去最強、という触れ込みです。同時に、その双子のような存在であるClaude Mythos 5も登場しました。名前だけ見ると神話と寓話で何のことやら、という感じですよね。私も最初はそう思いました。
この記事では、Fable 5がいったい何者なのか、何ができるのか、そしてMythos 5との違いや今回いちばんの肝であるセーフガードについて、できるだけ実務目線で整理してみます。SNSの反応はかなり熱いのですが、財布まわりやガードレールの厳しさといった現実的な声もあります。良い面と気になる面、両方を正直に並べていこうと思います。
目次
Claude Fable 5とは?「神話を一般公開用に安全化した」過去最強のClaude
Claude Fable 5は、Anthropicが2026年6月9日に一般公開した新しいAIモデルです。Anthropicの説明では「一般利用向けに安全化したMythosクラスのモデル」と位置づけられています。
ここでいったん整理が必要なのが、このMythosクラスという言葉です。AnthropicのモデルにはこれまでOpusやSonnet、Haikuといった階層がありました。Mythosクラスは、そのいちばん上にあったOpusクラスのさらに上に置かれた、新しい能力ティアだと考えるとわかりやすいと思います。最初のMythosクラスは2026年4月に、Project Glasswingという枠組みでごく一部の相手にだけ提供された「Claude Mythos Preview」でした。Fable 5は、その流れをくむ一般公開版にあたります。
つまり、これまで限られた人しか触れなかった最上位クラスの能力が、安全装置をつけたうえで、ようやく私たちの手元に降りてきた。そういう位置づけのモデルだと理解しておくと、今回の発表の意味が見えてきます。
Fable(寓話)とMythos(神話)は同じ中身、違いはセーフガードだけ
少しややこしいのが、Fable 5とMythos 5という二つの名前が同時に出てきたことです。結論から言うと、この二つは同じ基盤モデルです。中身は同一で、違いはセーフガード、つまり安全装置の有無だけなんですね。
Anthropicは語源にも触れていて、Fableはラテン語のfabula、語られるものという言葉から来ていて、ギリシャ語のmythos、神話に通じるそうです。同じ物語でも、誰に向けてどう語るかが違う。安全装置をかけて広く一般に届けるのがFable、装置の一部を外して信頼された相手にだけ渡すのがMythos、という住み分けになっています。
Mythos 5は当初、Project Glasswing経由でサイバー防御者や重要インフラの提供者など、ごく限られた相手にしか提供されません。世界最強のサイバーセキュリティ能力を持つとされていて、扱いを誤れば危険にもなりうる。だからこそ慎重に配っているわけです。私たち一般のユーザーが日常的に触れるのは、基本的にFable 5のほうだと思っておけば大丈夫です。
Claude Fable 5は具体的に何がすごいのか
抽象的な話が続いたので、もう少し地面に降ろしてみます。Fable 5は、ほぼすべてのベンチマークで最先端という評価を受けています。とくにタスクが長く、複雑になればなるほど、ほかのモデルとの差が開いていくのが特徴です。
長時間タスクとコーディングで群を抜く
いちばんわかりやすいのがソフトウェア開発の領域です。Fable 5はSWE-Bench Proというコーディングの評価で80.3%を記録し、次点のモデルに約11ポイント差をつけました。より難しいFrontierCode Diamondという課題でも29.3%で、Opus 4.8の13.4%を大きく上回っています。
数字だけだとピンとこないかもしれないので、具体的なエピソードを紹介します。決済サービスのStripeは早期テストで、5000万行という巨大なRubyのコードベースの全面的な移行を、Fable 5に1日でやらせたと報告しています。手作業なら、チームを組んで2か月以上かかる規模の作業です。それが1日。数か月分のエンジニアリングを数日に圧縮した、という表現が使われていました。
この「長く走り続けられる」という性質は、開発者にとってかなり大きいはずです。短い質問にうまく答えるだけなら、これまでのモデルでも十分でした。でも、目標をひとつ渡して、あとは長い時間ひとりで考えて手を動かし続けてもらう。そういう使い方が現実味を帯びてきたわけです。実際、後で触れるSNSの反応でも、ここに興奮している人がとても多い印象でした。
ビジョン・長文脈・知識労働まで一段上へ
強いのはコードだけではありません。Fable 5は画像を扱うビジョンの分野でも新しい最先端とされていて、スクリーンショットだけを見せてWebアプリのソースコードを組み直す、といった芸当もこなします。以前のClaudeが補助なしでは苦労していたゲームのプレイを、画面の映像だけを頼りにクリアした、という話もありました。
長い文脈を保ち続ける力も上がっています。数百万トークンという膨大な情報の中でも集中を切らさず、しかも自分でとったメモを使って出力を改善していく。大きなプロジェクトやリサーチを任せるなら、この粘り強さは効いてくるところです。
知識労働の面でも、金融分析のベンチマークで最高スコアを出したり、法務のレッドライン作業で現行モデルと同等以上と評価されたりしています。さらに双子のMythos 5になると、創薬やタンパク質設計、分子生物学といった科学研究の領域で、人間の専門家に匹敵あるいは凌駕する場面も出てきているそうです。新しくて説得力のある科学的な仮説を一貫して生み出せる、初めてのモデルだとAnthropicは説明しています。ここまでくると、もう道具というより研究のパートナーに近いのかもしれません。
今回の主役はセーフガード:危険な領域はOpus 4.8が肩代わりする
ここからが、今回の発表でいちばん語るべき部分だと思っています。能力の高さそのものより、それをどう安全に配るか。Anthropicが時間をかけて作り込んだのが、このセーフガード、つまり安全装置でした。
Mythosクラスのモデルは、能力が高いぶん深刻なリスクも抱えています。とくにサイバーセキュリティや生物・化学の領域では、悪意ある人の手に渡れば、本来なら得られない知識や助けを与えてしまう恐れがある。そこでFable 5には、分類器と呼ばれる別のAIシステムが組み込まれました。
フォールバックという新しい仕組みと、その「見えにくさ」
仕組みはこうです。サイバーセキュリティ、生物・化学、それからモデルの能力を抜き取るディスティレーションと呼ばれる行為。これらに関係するリクエストを分類器が検知すると、Fable 5本体ではなく、ひとつ下のClaude Opus 4.8が代わりに応答します。これをフォールバックと呼んでいます。発動したときには、ユーザーにもちゃんと知らされる仕組みです。
おもしろいのは、これが拒否ではないという点です。質問を突っぱねるのではなく、Opus 4.8という別の優秀なモデルが答えてくれる。Opus 4.8もそれ自体かなり高性能ですから、いきなり門前払いされるよりはずっといい体験だと思います。しかもAnthropicによれば、95%を超えるセッションではフォールバックがまったく起きません。その場合のFable 5は、実質的にMythos 5と同じ性能で動くことになります。
ただし、ここには気をつけたい点もあります。Anthropicは安全を優先して、装置を保守的にチューニングしたと認めています。つまり、無害なリクエストでも稀に引っかかってしまう。いわゆる偽陽性ですね。実際、一部の開発者からは、フロンティアのAI開発に関わるような高度な要求のときに、ユーザーに十分知らせないまま能力が静かに絞られることがある、という指摘も出ています。危険な出力を止めるのは受け入れるけれど、それが作業の信頼性に影響するなら透明性がほしい。そういう本音です。この声は、なるほどと思いました。便利さと安全のあいだで、まだ調整の途中なんだと思います。
なお、Mythosクラスのモデルでは、全トラフィックを30日間保持するという新しいデータ保持ポリシーも導入されました。学習には使わず安全目的に限るとされ、人によるアクセスはログに残し、原則として30日後に削除されるとのことです。企業で使う場合は、このあたりの扱いも頭に入れておくとよさそうです。
SNSのリアルな声:開発者の興奮と、価格・ガードレールへの本音
ここで、発表を受けたSNSの反応を見てみます。今回は前回のSiri AIのときとは温度感がだいぶ違っていて、全体としてはかなりポジティブでした。リリース直後からClaude公式アカウントの投稿が数十万のいいねやビューを集め、開発者コミュニティを中心に一気に広がっていった印象です。
ポジティブ優勢、でも財布とトークン上限は別の話
まず肯定的な反応から。能力の高さを称える声がとても目立ちました。著名な研究者のAndrej Karpathyをはじめ、多くの開発者が、メジャーバージョンの更新に値する大きな進化だと評価しています。長くて難しい問題を解かせたときに特に強い、もうコードを任せたくなるレベル、といった声ですね。Cursorのようなツールでベンチマークが上がった、という報告も多く流れていました。
実用面の興奮も大きかったです。目標を与えて放置できる、大規模なプロジェクトやリサーチに向いている、ソフトウェア開発の生産性が爆発的に上がりそう。そんな期待の言葉が並んでいました。GitHub CopilotやさまざまなエディタがFableにすぐ対応したこともあって、出たその日から触れる手軽さが歓迎されたのだと思います。一般公開されたMythos級の安全版、というアクセスのしやすさそのものを喜ぶ声も多かったです。
一方で、冷静な懸念もちゃんとありました。いちばん多かったのが価格とトークン消費の話です。Anthropic公式のAPI価格は入力が100万トークンあたり10ドル、出力が50ドル。これを高めと感じる人は少なくなく、より安く使える第三者のアグリゲーター経由を勧める投稿も目立ちました。日本のユーザーからは、トークンの上限にすぐ届いて泣く、という切実な声も上がっていたそうです。能力が上がっても、毎日の財布の話は別、というわけですね。
もうひとつがガードレールの厳しさです。安全対策が過剰に反応しやすい、危険なトピックでもないのにOpus 4.8にフォールバックされる、という初期フィードバックがありました。企業のセキュリティポリシー、とくにデータ保持の面での制約を心配する声もあります。ちなみにジョーク混じりの投稿も流れていて、ChatGPTにFable 5の使い方を聞いてみた、なんて軽い話題もあったようです。こういう肩の力が抜けた反応が出てくるあたり、注目度の高さがうかがえます。
まとめると、今回は期待と興奮が優勢。でも、その足元には価格とガードレールという現実的な引っかかりがある。この温度感は、記事として正直に書いておきたいところです。
使う前に知っておきたい注意点と現実
ここまで読んで使ってみたくなった方もいると思います。ただ、飛びつく前に押さえておきたい現実的な前提があります。とくに大事な点を整理しておきます。
- 料金は入力100万トークンあたり10ドル、出力100万トークンあたり50ドルです。Mythos Previewの半額以下ですが、Opus 4.8と比べると高めという見方もあります。ただし少ないターンで仕事を終えるぶん、実効コストは抑えられるという報告もあります。
- サブスクの扱いには期限があります。Pro、Max、Team、シート制のEnterpriseでは、6月9日から22日までは追加費用なしで使えますが、6月23日にいったん外れ、その後はusage creditsが必要になります。容量が整えば標準プランに戻す方針とされています。
- 危険性が高いとみなされた領域では、Fable 5本体ではなくOpus 4.8がフォールバックで応答します。サイバーや生物・化学に関わる作業をしている人は、この挙動を前提にしておく必要があります。
- 保守的なチューニングのため、無害な質問でも稀にフォールバックが起きることがあります。Fableの本領が出ない場面もある、と知っておくと戸惑わずに済みます。
- 公開されている多くのベンチマークやデモは、Anthropic自身が出したものです。第三者による独立した検証が出そろうまでは、断定せずに見ておくのが無難だと思います。
Fable 5とどう付き合うか
最後に、このモデルとどう向き合うかについて、私なりの考えを少しだけ書いておきます。
(1)いきなり重要な仕事を丸投げしないこと。
Fable 5は長時間の自律作業に強いので、つい全部任せたくなります。でも、最初は失敗しても痛くない小さなタスクから渡してみるのがいいと思います。コードの一部、調べものの下ごしらえ、文章のたたき台。そのくらいから始めて、出てきた結果を自分の目で確かめる。任せられそうだと感じたら、少しずつ範囲を広げていく。成功も失敗も、自分にとってのデータとして積み上げていけばいいんじゃないでしょうか。
(2)フォールバックを敵だと思わないこと。
能力が制限される場面に出くわすと、最初はもどかしく感じるかもしれません。でも、あれは危険を避けるための仕組みで、しかも代わりに答えてくれるOpus 4.8も十分に賢い。完璧な自由より、安全な広がりを選んだ設計なんだと受け止めると、付き合いやすくなる気がします。気になる部分は、Anthropicも今後改善していくと言っています。
(3)最終的な判断と責任は自分が持つ、という姿勢を手放さないこと。
Fable 5がどれだけ賢くなっても、出てきた答えをそのまま鵜呑みにしていい理由にはなりません。むしろAIに任せる割合が増えるほど、それを検証して使う人間の責任は重くなる。便利さと引き換えに、確認する習慣まで手放してしまわないこと。ここは強調しておきたいと思います。
Claude Fable 5が本当に世界を変えるのかは、正直まだわかりません。ベンチマークの数字もデモも魅力的ですが、実物が日々の仕事の中で同じように動くかどうかは、これから多くの人が触って確かめていく段階です。それでも、短く答えるAIから、長く考えて動いてくれるAIへ。その方向そのものは、たぶん間違っていないと思います。まずは小さく試してみる。その積み重ねが、自分なりの使い方として残っていくはずです。
コメント