Sakana AIがマルチエージェント基盤モデル「Fugu」のβテストを開始

エージェント日本 APIベータ公開 04/26 07:42

Sakana AIが2026年4月24日に公開した「Sakana Fugu」は、単一モデルの性能を競う従来のAI API市場に対し、複数フロンティアモデルを動的に束ねるオーケストレーション層そのものを商用APIとして提供するという新しいアプローチを取る。

技術的な核心は、Sakana Fugu自体が小規模言語モデルであり、LLMを呼び出すことを学習している点にある。さらに自身を再帰的に呼び出す設計により、推論時に計算の深度を調整できるテスト時スケーリングが実現する。この再帰の深さは推論時に変更でき、モデルの再学習は不要だ。技術基盤はICLR 2026に採択された論文「TRINITY」（arXiv:2512.04695）と「Conductor」（arXiv:2512.04388）であり、商用化にあたってさらに改良が加えられている。

ベンチマーク上の結果として、fugu-ultraはGPQA-Dで95.1（Gemini 3.1 highの94.4・Claude Opus 4.6 maxの92.7を上回る）、LCBv6で93.2（GPT 5.4 highの92.1・Opus 4.6 maxの92.4を上回る）、SWEProで54.2（Opus 4.6 maxの53.4・GPT 5.4 highの51.2を上回る）を記録している。なお、SWEProの評価にはmini-swe-agentのスキャフォールドを使用しており、Anthropicが公表しているOpus最大思考モードのスコアについては、評価試行中に頻繁にタイムアウトが発生したためAnthropic公式の報告値を採用している点は留意が必要だ。

日本の開発現場への影響として最も直接的なのは、OpenAI互換エンドポイントへの対応だ。現在GPT・Gemini・Claude APIを利用しているチームは、既存のワークフローをほぼ変えずにSakana Fuguへ接続できる。複数のAPIキーを管理し、タスクごとにモデルを手動で選択していた運用コストを、オーケストレーション層に委譲できる点は実務上の採用障壁を下げる。

一方で、オーケストレーション層が内部で複数プロバイダーのモデルを呼び出す構造は、データの処理経路の透明性という観点で新たな確認事項を生む。日本の企業・行政が業務データを扱う場合、どのモデルがどのデータを処理するかを把握し、各プロバイダーの利用規約・データ保護要件との整合性を確認することが求められる。βテスト段階であるため、価格体系や可用性の詳細は現時点では公開されていない。

押さえるポイント

fugu-ultraがGPQA-D 95.1・SWEPro 54.2で主要最上位モードを全項目で上回る
OpenAI互換エンドポイント対応で既存APIワークフローからの移行コストが最小
モデルが自身を再帰的に呼び出す設計で再学習不要の推論時スケーリングを実現

5W1Hでサクッと理解 誰が Sakana AI 
 何を マルチエージェントAPI公開 
 いつ 2026年4月24日 
 どこで APIベータ公開 
 なぜ 複数モデル管理の非効率解消 
 どのように OpenAI互換エンドポイント 

何が起きたか

要点Sakana AIが、小規模言語モデル自体が複数のLLMを動的に呼び出すことを学習するマルチエージェント・オーケストレーションシステム「Sakana Fugu」をAPIとして公開し、βテスターの募集を2026年4月24日に開始した。fugu-ultraはコーディング・数学・科学推論の主要ベンチマークでGemini 3.1・GPT 5.4・Claude Opus 4.6の最上位モードを上回るスコアを記録している。

3つの視点で読む

開発現場

小規模モデルがLLMを呼び出すことを学習し、さらに自身を再帰的に呼び出すことで推論時に計算深度を調整できる新アーキテクチャが実証された。再学習不要でテスト時スケーリングが実現するため、モデルの再訓練コストをかけずに推論品質を段階的に引き上げられる設計上の選択肢が生まれる。

事業判断

単一モデルAPIの性能競争に対し、オーケストレーション層を商用APIとして提供するという新たな競争軸が登場した。既存のGPT・Gemini・Claude APIユーザーが乗り換えやすい互換設計は、OpenAI・Google・Anthropicの顧客基盤に直接訴求する構造であり、日本企業のAI API選定においてコスト効率と性能の両面で比較対象に加わる。

リスク・ルール

オーケストレーション層が複数プロバイダーのモデルを内部で呼び出す構造は、データの処理経路や責任主体の所在が単一モデルAPIより複雑になる。日本の企業・行政がSakana Fuguを業務利用する際には、どのモデルがどのデータを処理するかの透明性と、各プロバイダーの利用規約・データ保護要件との整合性を個別に確認する必要がある。

追い風と向かい風

追い風を受ける側

複数モデルAPIを使い分けている日本の開発チーム複数APIキーの管理コストと手動でのモデル選択作業をSakana Fuguに委譲できるため、運用負荷が下がる
Sakana AI研究成果をICLR 2026採択論文から商用APIへ転換し、国際市場向けフラッグシップ製品として位置づけることに成功した
コーディング・数学・科学推論用途のエンジニア・研究者fugu-ultraがSWEPro 54.2・GPQA-D 95.1と既存最上位モードを上回るスコアを示しており、これらの用途でのAPI選定候補が増える

向かい風を受ける側

OpenAI・Google・Anthropic（単一モデルAPI提供者）Sakana Fuguがそれぞれのモデルを内部で利用しつつ、ユーザーとの直接接点（APIエンドポイント）を代替する構造であり、顧客の乗り換え先になりうる
手動マルチモデル管理を前提に構築した既存ワークフローオーケストレーション層が自動化する範囲と既存の手動ルーティングロジックが重複し、設計の見直しコストが発生する

今やるべきこと

技術判断 確認する fugu-ultraのベンチマーク評価条件（SWEProのスキャフォールド構成・GPQA-Dの評価フレームワーク）を公式ソースで確認し、自社ユースケースとの乖離を把握する

事業判断 比較する現在利用中のGPT・Gemini・Claude APIの月次コストとfugu-miniおよびfugu-ultraのβテスト条件を比較し、性能向上幅とコスト変化のトレードオフを定義する

実装・検証 試す βテストに申し込み、既存のOpenAI互換ワークフローをそのままfugu-miniに接続して、レイテンシと出力品質の変化を現行モデルと並列で記録する

時系列タイムライン

2026年以前 Sakana AIが進化的モデルマージ・AIサイエンティスト・ShinkaEvolve・AB-MCTSなどマルチエージェント研究を継続的に発表
ICLR 2026採択技術基盤論文「TRINITY」（arXiv:2512.04695）および「Conductor」（arXiv:2512.04388）がICLR 2026に採択
2026年4月24日 Sakana Fuguをフラッグシップ商用AIプロダクトとして発表し、βテスター募集を開始
βテスト期間中（予定）研究者・エンジニアによる社内未検証領域でのテストを通じ、性能・課題・ニーズを収集

情報ソース

Sakana Fugu: A Multi-Agent Orchestration System as a Foundation Model 公式一次情報技術製品発表

エージェントの記事

読み込み中...

押さえるポイント

5W1Hでサクッと理解

何が起きたか

3つの視点で読む

追い風と向かい風

今やるべきこと

時系列タイムライン

SNSの反応

主な声

関連コンテンツ

関連キーワード

関連するAIトレンド記事

情報ソース

人気記事ランキング

エージェントの記事