cd /news/artificial-intelligence/sakana-fugu-one-model-to-command-the
 · home › topics › artificial-intelligence › article
[ARTICLE · art-36011] src=sakana.ai ↗ pub= topic=artificial-intelligence verified=true sentiment=↑ positive

Sakana Fugu: One Model to Command Them All

Sakana AI released Fugu Ultra, a multi-agent orchestration system that matches frontier models like Anthropic's Fable 5 and Mythos Preview on benchmarks while avoiding single-vendor dependency. The model dynamically routes around export controls by swapping agents, offering a resilient alternative for AI sovereignty.

read8 min views1 publishedJun 21, 2026
Sakana Fugu: One Model to Command Them All
Image: Sakana (auto-discovered)

Sakana AI Releases ‘Fugu Ultra’ to Match Frontier Performance via Autonomous Model Orchestration.

Our Fugu Ultra model stands shoulder-to-shoulder with leading models like Anthropic’s Fable 5 and Mythos Preview across the industry’s most rigorous engineering, scientific, and reasoning benchmarks while delivering frontier capability without the risk of export controls.

日本語は英文の埌に We are excited to introduce Sakana Fugu, a new product from Sakana AI that delivers a full multi-agent orchestration system as a single foundation model. Fugu dynamically orchestrates the world’s best models to tackle complex, multi-step tasks, accessible through a single model API. The result is multi-agent intelligence delivering the very best frontier-level performance without any single-vendor dependency or the complexity of a traditional multi-agent system.

**👉 **Sakana Fugu Sakana Fugu is itself a language model trained to call various LLMs in an agent pool, including instances of itself recursively. Fugu dynamically orchestrates the world’s best models to tackle complex, multi-step tasks. Plug collective intelligence directly into your workflows today with a single API.

Beyond Bigger Models: Orchestration Models are the Next Frontier

For the past few years, progress in AI has been driven largely by brute-force scale: building giant, monolithic models trained on ever-larger amounts of data. But hard, real-world tasks require a multitude of specialized knowledge and skills, far beyond any individual benchmark. Unlocking the very best performance therefore requires collective intelligence: knowing which model to use, delegating tasks such as planning and execution, and combining domain-specific strengths while routing around individual weaknesses. Since our founding, Sakana AI has been guided by a core conviction: the most powerful AI systems will not be isolated monoliths, but collaborative ecosystems. Evolution innovates under constraints, and the future belongs to systems that explicitly learn how to coordinate collective intelligence.

Today, this orchestration is no longer just a technical optimization; it has become a geopolitical and operational imperative. Recent disruptions in the AI landscape have demonstrated the severe risk of single-vendor dependency. For an organization or a nation, relying on a single company’s APIs for critical infrastructure, finance, or governance is a material vulnerability. This risk is no longer a hypothetical possibility, but a reality. As we have seen recently from export controls imposed on Anthropic’s Fable and Mythos models, access can shift or disappear overnight due to changing regulatory boundaries, export controls, and foreign policies.

Collective intelligence serves as the practical hedge against this concentration of power. Sakana Fugu is powered by models trained to be powerful orchestrators with an underlying pool of entirely swappable agents. If a single provider restricts access, Fugu dynamically routes around the disruption. Over time, Sakana Fugu will naturally grow by incorporating newer, more efficient models, including our own. By orchestrating the world’s models, we are delivering the realistic, resilient blueprint required for AI sovereignty.

What Is Sakana Fugu?

Sakana Fugu is a multi-agent system that behaves like a single model. You send a request to one endpoint, and Fugu decides how to handle it: solving it directly when that is enough, or assembling and coordinating a team of expert models when a task calls for more. It manages model selection, delegation, verification, and synthesis internally, so the complexity of a multi-agent system never reaches your code.

What makes this possible at scale is that Fugu is itself a language model specialized to understand when to delegate, how agents should communicate, and how to combine their work into a single, reliable answer. This approach builds on our research on learned model orchestration, including our recent ICLR 2026 papers Trinity and the Conductor. From the outside, you simply call one model. On the inside, a coordinated system of experts is doing the work.

Fugu and Fugu Ultra

At launch, Sakana Fugu comes in two models, so you can match the system to your workload. Both models can be accessed via a single OpenAI-compatible API.

Fugu balances strong performance with low latency, making it a great default for everyday work. It fits naturally into tools like Codex for coding and code review, as well as chatbots and other interactive services. For teams with data, privacy, or compliance requirements, Fugu also lets you opt specific agents out of its pool.

Fugu Ultra is tuned for maximum answer quality on hard, multi-step problems, coordinating a deeper pool of expert agents when accuracy and depth matter most. Early users have relied on it for demanding work such as AI research, paper reproduction, cybersecurity analysis, and literature and patent investigations.

Here is how the two models perform across standard benchmarks:

Our Fugu Ultra model stands shoulder-to-shoulder with leading models like Fable 5 and Mythos Preview across the industry’s most rigorous engineering, scientific, and reasoning benchmarks. It delivers frontier capability without the risk of export controls.

*Performance comparison of Fugu models and baseline frontier models across a suite of coding, reasoning, scientific, and agentic benchmarks. All scores other than Fugu’s are reported by the model providers. For Fable 5 and Mythos Preview, we report the max of the two if both scores are available on the same benchmark. Neither of them is in Fugu’s agent pool as they are not publicly accessible. For more details, please refer to our *technical report.

Benchmark results comparing Fugu with underlying foundation models used by Fugu, where highest scores are in boldface and the second highest are underlined:

We use the mini-swe-agent as the scaffolding for this task.

†We use model provider-reported scores for the baselines.

What Early Users Are Building

Benchmarks tell only part of the story. Fugu’s value shows up most clearly in long, messy, real-world workflows, which is exactly what we focused on during our beta program with close to 500 early users, whose feedback helped us improve the system.

Applications of Fugu Models. In our experiments, we find that Fugu Models consistently outperform frontier models Gemini 3.1 Pro (high), Opus 4.8 (max), and GPT 5.5 (xhigh) for various applications, such as AutoResearch, Rubik’s Cube, Mechanical Design, Japanese Handwriting Analysis, One-Shot Chess, Financial Time Series Prediction.

One of the clearest signals came from automated data science research: early users running Sakana Fugu in an almost fully automated research mode saw it drive meaningful progress with little to no human intervention. For us, this is exactly the kind of task Fugu Ultra is designed for: open-ended, multi-step work where the system needs to explore ideas, run experiments, interpret failures, revise its approach, and keep making progress over time.

Here is what other users are saying:

“For code review, Fugu Ultra is significantly better than GPT-5.5. It gives comprehensive answers and finds the bugs others miss. Where other tools flag about three issues, Fugu surfaced more than twenty. It's become the model I run all my reviews through.” *

** — Software Engineer, on Coding and Code Review **

“Raw output quality is on par with top frontier models, but Fugu showed unusually strong persona stability across long sessions, holding its identity where other models drift. For agent products, that may matter more than raw benchmark scores. *

** — Executive at Enterprise Platform Company, on Orchestration Quality **

“Given one scoped instruction, Fugu drove a full security assessment end-to-end — recon, XSS/SQLi checks, auth review, and a clean report with evidence and retest steps — staying inside scope and avoiding destructive actions.” *

** — Cyber Security Engineer, on Security Assessment Analysis **

We saw similar patterns across paper reproduction, cybersecurity analysis, code review, and literature and patent investigations. In these workflows, the value of Fugu is not just a better answer to one prompt, but sustained progress across many steps: reading, implementing, testing, comparing evidence, finding gaps, and producing a useful final analysis or report. The beta made clear that multi-agent orchestration matters most when the task is messy, long-running, and difficult to solve with a single model call.

Sakana Fugu is generally available today. You can access both Fugu and Fugu Ultra through a single API, with subscription tiers for everyday use and a pay-as-you-go plan for heavier and enterprise workloads. To get started, visit our product page or console site.

Looking Ahead

We are deeply grateful to our early users who put Fugu through real, demanding work and helped us shape what it is today. This launch is a starting point, not a finish line. Because Fugu is built on learned orchestration rather than fixed workflows, it improves as the underlying ecosystem improves: as new frontier models arrive, we can fold them into Fugu’s agent pool and pass the gains on to you. In the months ahead, we plan to expand the pool of expert agents, including open models and Sakana AI’s own models, to strengthen coordination for long-running and agentic tasks, and give users more control over how Fugu works on their behalf. We are excited to see what you build with it.

We are looking for people to help shape the future of AI together with Sakana AI. Please see our careers page.

Publications

Sakana Fugu Technical Report, Fugu Team, Sakana AI, 2026.

Xu, Sun, Schwendeman, Nielsen, Cetin, Tang. TRINITY: An Evolved LLM Coordinator. ICLR 2026.

https://arxiv.org/abs/2512.04695 Nielsen, Cetin, Schwendeman, Sun, Xu, Tang. Learning to Orchestrate Agents in Natural Language with the Conductor. ICLR 2026.

https://arxiv.org/abs/2512.04388 Japanese

Sakana AI、自埋的なモデルオヌケストレヌションでフロンティア性胜に䞊ぶ「Fugu Ultra」を提䟛開始

Fugu Ultraは、゚ンゞニアリング・科孊・掚論ずいった業界屈指の厳しいベンチマヌクにおいお、AnthropicのFable 5やMythos Previewずいった最先端モデルに比肩したす。しかも茞出芏制のリスクを負うこずなく、フロンティアレベルの胜力を発揮したす。

Sakana AIは、マルチ゚ヌゞェントのオヌケストレヌションシステムを䞀぀の基盀モデルずしお提䟛する新プロダクト「Sakana Fuguサカナ・フグ」の提䟛を開始したす。Sakana Fuguは、最高性胜のモデル矀を動的にオヌケストレヌションしお耇雑で倚段階のタスクに取り組むシステムであり、単䞀のモデルAPIから利甚できたす。これにより、䞀぀のベンダヌに䟝存するこずなく、たた自身で耇雑なそうしたシステムを぀くるこずなく、フロンティアレベルの性胜を備えたマルチ゚ヌゞェントの胜力を利甚できたす。

**👉 **Sakana Fugu Sakana Fugu自䜓が䞀぀の蚀語モデルであり、゚ヌゞェントプヌル内のさたざたなLLMを呌び出すように孊習されおいる。そこでは自分自身を再垰的に呌び出すこずもある。Sakana Fuguは、最高性胜のモデル矀を動的にオヌケストレヌションし、耇雑で倚段階のタスクに取り組むこずで、その集合知を䞀぀のAPIですぐにワヌクフロヌに組み蟌むこずを可胜にする。

スケヌリングの先ぞ次のフロンティアずしおのオヌケストレヌションモデル

この数幎、AIの進歩は䞻にスケヌルの远求、すなわち巚倧で䞀枚岩のモデルをたすたす倧量のデヌタで孊習させるこずによっお牜匕されおきたした。しかし、珟実䞖界の難しいタスクでは、単䞀のモデルを䞀床呌び出すだけで最良の結果が埗られるこずはほずんどありたせん。どのモデルを䜿うか、い぀凊理を委譲するか、途䞭の䜜業をどう怜蚌するか、そしお個々のモデルの匱点を避け぀぀、それぞれの匷みをどう組み合わせるか。AIの最先端の胜力は、こうした耇数モデルの集合知をいかに掻甚するかに関する刀断の積み重ねによっお匕き出されたす。

Sakana AIは創業以来、たった䞀぀倧きなモデルではなく、耇数のモデルが協調する゚コシステムを぀くるこずで最も匷力なAIシステムが実珟できるずいう考え方を倧切にしおきたした。生物進化が様々な制玄のもずで新たな解を芋぀けおきたように、集合知をどう協調させるかを自ら孊習するシステムがこれからは重芁になるず考えおいたす。

こうしたオヌケストレヌションは、技術的に理にかなったアプロヌチであるだけではなく、いたや地政孊的にも、実務面でも、避けお通れない技術になっおいたす。近幎のAIをめぐる動向は、単䞀ベンダヌぞの䟝存が抱える深刻なリスクを浮き圫りにしたした。組織にずっおも囜家にずっおも、重芁むンフラや金融、行政を䞀瀟のAPIに頌っお動かすこずは、珟実的な匱点になり埗たす。そしおこのリスクは、もはや仮定の話ではなくなっおいたす。最近のAnthropicのFable 5およびMythos 5モデルに課された茞出芏制に芋られたように、芏制の枠組みや茞出管理、各囜の政策が倉われば、アクセスの条件は䞀倜にしお倉わり埗たす。

集合知によるアプロヌチは、このような特定のプレむダヌぞの集䞭に察する、珟実的な備えにもなりたす。Sakana Fuguはオヌケストレヌションのためのモデルずしお孊習させたものであり、その背埌で甚いるモデル矀は、必芁に応じお柔軟に入れ替え可胜です。仮にあるプロバむダヌが利甚を制限しおも、Sakana Fuguはその圱響を動的に迂回したす。今埌は、より新しいモデルや、Sakana AI自身のモデル、その他のオヌプンモデルも、随時プヌルに加えたり、入れ替えたりしおいく予定です。䞖界䞭のモデルをオヌケストレヌションするこずで、AI䞻暩AI sovereigntyを支える、珟実的で確かな遞択肢を瀺しおいきたいず考えおいたす。

Sakana Fuguずは

Sakana Fuguは、単䞀のモデルのように振る舞うマルチ゚ヌゞェントシステムです。ナヌザヌが䞀぀の゚ンドポむントにリク゚ストを送るず、Sakana Fuguがその凊理方法を刀断したす。単独モデルで十分な堎合はそのたた解き、より高床な察応が求められる堎合には専門モデルのチヌムを線成しお連携させたす。モデルの遞択、委譲、怜蚌、統合をすべお内郚で管理するため、マルチ゚ヌゞェントシステムの耇雑さがナヌザヌのコヌドに及ぶこずは䞀切ありたせん。

これを可胜にしおいるのは、Sakana Fugu自身が「協調の仕方」を孊習しおいるためです。どのモデルが䜕を担うかを人手で定めたルヌルに埓うのではなく、い぀委譲すべきか、゚ヌゞェント同士がどう察話すべきか、そしおそれぞれの成果をどのように䞀぀の信頌できる答えぞずたずめ䞊げるかを、Sakana Fugu自身が孊習したす。このアプロヌチは、孊習によるモデルオヌケストレヌションに関する私たちの最近の研究であるTrinityやConductorいずれもICLR 2026採択論文を基盀ずしおいたす。倖からは、ナヌザヌは単に䞀぀のモデルを呌び出しおいるだけですが、内偎では協調する゚キスパヌトのシステムが働いおいたす。

FuguずFugu Ultra

今回、Sakana Fuguずしお提䟛を開始するのは、ワヌクロヌドに合わせお遞べる2぀のモデル、FuguずFugu Ultraです。いずれもOpenAI互換の単䞀のAPIを通じお利甚できたす。

Fuguは、高い性胜ず䜎レむテンシのバランスに優れ、日垞的な業務のデフォルトずしお最適なモデルです。コヌディングやコヌドレビュヌにおけるCodexのようなツヌルはもちろん、チャットボットをはじめずするむンタラクティブなサヌビスにも自然に組み蟌めたす。デヌタやプラむバシヌ、コンプラむアンスに関する芁件を持぀チヌム向けには、特定の゚ヌゞェントをプヌル゚ヌゞェント矀から陀倖するこずもできたす。

Fugu Ultraは、困難な倚段階の問題に察する回答品質を最倧化するよう調敎されおおり、粟床ず深さが最も重芁な堎面では、より厚みのある専門゚ヌゞェント矀を連携させたす。テストナヌザヌは、デヌタ分析、論文の再珟、サむバヌセキュリティ分析、文献・特蚱調査ずいった負荷の高い業務でFugu Ultraを掻甚しおいたした。

FuguずFugu Ultraの暙準的なベンチマヌクにおける性胜は以䞋の通りです。

コヌディング、リヌズニング、科孊、゚ヌゞェント胜力に関するベンチマヌク矀における、Fuguモデルずベヌスラむンのフロンティアモデルの性胜比范。Fugu以倖のスコアは、いずれも各モデル提䟛元が公衚した倀。Fable 5ずMythos Previewに぀いおは、同䞀ベンチマヌクで䞡方のスコアが入手できる堎合、その高い方を採甚した䞡モデルは䞀般提䟛されおいないため、Fuguの゚ヌゞェントプヌルには含たれおいない。詳现はテクニカルレポヌトを参照。

Sakana Fuguず、Sakana Fuguが内郚で利甚する基盀モデルを比范したベンチマヌク結果は以䞋の通りです。

このタスクのスキャフォヌルディングにはmini-swe-agentを䜿甚。

†ベヌスラむンのスコアは各モデル提䟛元による公衚倀。

テストナヌザヌが芋出したSakana Fuguの力

Sakana Fuguの真䟡は、ベンチマヌクの点数だけでは枬りきれたせん。長く入り組んだ珟実䞖界のワヌクフロヌにおいおこそ、その䟡倀が珟れるためです。そのこずを確かめるため、500名近いテスタヌの協力を埗おベヌタプログラムを実斜し、そこで寄せられたフィヌドバックをもずにシステムを改善したした。

Fuguモデルの掻甚䟋。 AutoResearch、ルヌビックキュヌブ、機械蚭蚈、日本語の手曞き文字解析、チェス、金融時系列予枬ずいった実隓を行った。いずれの甚途においおも、FuguモデルはフロンティアモデルであるGemini 3.1 Prohigh、Opus 4.8max、GPT 5.5xhighを䞊回るこずが瀺された。

ベヌタテストでは、あるナヌザヌは、Sakana Fuguのリサヌチモヌドを甚いお、デヌタ分析をほが自動で進めたした。デヌタ分析は、たさにFugu Ultraが想定しおいるタスクそのものです。アむデアを探玢し、実隓を実行し、倱敗を読み解き、アプロヌチを修正しながら、長い時間をかけお少しず぀前進し続ける、答えの定たらない倚段階の䜜業だからです。

その他、実際に寄せられた声を玹介したす。

「コヌドレビュヌでは、Fugu Ultra は回答が網矅的で、他のモデルが芋逃すバグたで芋぀けおくれたした。他のツヌルでは3件くらいの問題しか指摘されなかったのに察し、Sakana Fuguは20件以䞊を掗い出しおくれたした。」 *

** — ゜フトりェア゚ンゞニア **

「玠の出力品質はトップクラスのフロンティアモデルず同等だず感じたした。加えお Sakana Fuguは、長時間のセッションでもペル゜ナが安定しおおり、他のモデルなら厩れおしたう堎面でもキャラクタヌを保ち続けたした。゚ヌゞェントにずっおは、これは単玔なベンチマヌクスコア以䞊に重芁なこずです。」 *

** — ゚ンタヌプラむズ向けプラットフォヌム䌁業の経営局 **

「範囲を絞った指瀺を䞀぀枡しただけで、Sakana Fuguは情報収集から XSS/SQLi の怜査、認蚌たわりのレビュヌ、さらに蚌拠ず再テスト手順を備えた敎然ずしたレポヌト䜜成たで、セキュリティ評䟡を䞀気通貫でこなしたした。しかも指定した範囲を逞脱せず、システムを壊すような操䜜も避けおくれたした。」 *

** — サむバヌセキュリティ゚ンゞニア **

論文の再珟、サむバヌセキュリティ分析、コヌドレビュヌ、文献・特蚱調査など、これらのワヌクフロヌでSakana Fuguがもたらす䟡倀は、単䞀のプロンプトにより良い回答を返すこずにずどたりたせん。読み蟌み、実装、テスト、蚌拠の比范、䞍足の掗い出し、そしお有甚な最終的な分析やレポヌトの䜜成たで、倚くのステップにわたっお着実に前進し続けられる点にありたす。タスクが入り組んでいお長時間に及び、単䞀のモデル呌び出しでは解きにくいようなタスクこそ、マルチ゚ヌゞェントのオヌケストレヌションは最も効果を発揮したす。

Sakana Fuguは、本日より䞀般提䟛を開始したす。FuguずFugu Ultraはいずれも単䞀のAPIを通じお利甚でき、日垞利甚向けのサブスクリプションプランに加え、より負荷の高い甚途や゚ンタヌプラむズ向けの埓量課金プランをご甚意しおいたす。詳しくはプロダクトペヌゞたたはコン゜ヌルサむトをご芧ください。

おわりにSakana Fuguのこれから

実際の負荷の高い業務でSakana Fuguを詊し、今日の姿ぞず磚き䞊げる手助けをしおくださったベヌタテスタヌの皆さたに、心より感謝申し䞊げたす。今回のリリヌスは出発点であり、ゎヌルではありたせん。Sakana Fuguは固定的なワヌクフロヌではなく、孊習によるオヌケストレヌションの䞊に成り立っおいたす。そのため、基盀ずなる゚コシステムが進歩するほど、Sakana Fugu自身も進化したす。新たなフロンティアモデルが登堎すれば、それをSakana Fuguの゚ヌゞェント矀に取り蟌み、その恩恵をナヌザヌぞお枡しできたす。

今埌数ヶ月のうちに、専門゚ヌゞェントのプヌルを拡充し、長時間のタスクや゚ヌゞェント的なタスクにおける協調を匷化し、Sakana Fuguの振る舞いをナヌザヌがより现かく制埡できるようにしおいく予定です。皆さたがSakana Fuguを䜿っお䜕を生み出しおくださるのか、開発者䞀同、心から楜しみにしおいたす。

Sakana AIは、AIの未来を私たちず䞀緒に切り拓いおくださる方を募集しおいたす。圓瀟の募集芁項をご芧ください。 関連論文

Sakana Fugu Technical Report, Fugu Team, Sakana AI, 2026.

Xu, Sun, Schwendeman, Nielsen, Cetin, Tang. TRINITY: An Evolved LLM Coordinator. ICLR 2026.

https://arxiv.org/abs/2512.04695 Nielsen, Cetin, Schwendeman, Sun, Xu, Tang. Learning to Orchestrate Agents in Natural Language with the Conductor. ICLR 2026.

https://arxiv.org/abs/2512.04388

── more in #artificial-intelligence 4 stories · sorted by recency
── more on @sakana ai 3 stories trending now
sponsored brought to you by zahid.host 4,200+ EU-deployed projects
reading about agents? ship yours in a single git push.

Run your AI side-project on zahid.host

EU-based hosting, git-push deploys, automatic HTTPS, no cold starts. Free tier with a custom domain — perfect for shipping the agent you just read about.

$git push zahid main
→ Live at https://your-agent.zahid.host ✓
Get free account → Pricing
from €0/mo · no card required
LIVE [news/sakana-fugu-one-mode
] indexed:0 read:8min 2026-06-21 · —