SamurAIGPT:生成メディアスキル公開
画像: AI生成

『Generative-Media-Skills』は、AIコーディングエージェントが画像・動画・音声を生成するためのスキル集をまとめたリポジトリで、2026年5月3日にGitHubで公開された。Claude Code、Cursor、Gemini CLIという主要3環境に対して、npx skills add コマンド1行でインストールできる点が特徴になっている。

構造は2層に分かれている。Core層はmuapi.aiの薄いAPIラッパーとして100以上のモデル(Midjourney v7、Flux Kontext、Seedance 2.0、Kling 3.0、Veo3など)へのアクセスを提供する。Library層はその上に、映画監督、UIデザイナー、ロゴ作成といった役割別の専門スキルを積み上げる設計になっている。役割プロンプトとAPI呼び出しを分離することで、エージェント開発者はユースケースごとに必要なスキルだけを選んで組み込める。

MCPサーバーモードでは、テキストから画像・動画生成、音楽生成、顔スワップ、AI切り抜き、長尺動画を縦型ショートに自動変換するAI Clippingなど19種類のツールがJSON Schema付きで公開される。Claude Desktopから直接呼び出せるため、シェルスクリプトを書かずにマルチモーダル生成をエージェントワークフローに組み込める。

日本の開発現場への影響としては、動画生成機能を持つプロダクトを内製する際の統合工数が下がる点が実用的だ。これまでVeo3やKlingを自社サービスに組み込むには個別のAPI契約とSDK統合が必要だったが、muapi.aiのゲートウェイを経由することで契約面・実装面の両方が一本化される。ライセンスはMITで、スキル層の改変・再配布の自由度は高い。一方、顔スワップ等を含むため、生成物の用途管理は利用側の実装責任に残る。