VACE×SkyReels V3融合｜骨格制御の動画生成WF公開

AI TREND

Civitai投稿者：R2V動画WF公開

Civitai上で、VACE（All-in-One動画生成・編集モデル）とSkyReels V3をマージし、スケルトン（骨格）誘導でリファレンス動画から新たな動画を生成するワークフロー「VACE SkyReels V3 R2V Merge Skeleton-Guided Video Workflow」が公開された。

3 の要点を3分で

Civitaiで公開された「VACE SkyReels V3 R2V Merge Skeleton-Guided Video Workflow」は、近年急速に整備されてきたオープンな動画生成エコシステムの「組み合わせ運用」を象徴する事例である。

中核となるVACEは、ali-vilabが公開する動画生成・編集の統合フレームワークで、論文「VACE: All-in-One Video Creation and Editing」（huggingface.co/papers/2503.07598）として公表されている。参照画像、マスク、各種コントロール信号を一つのモデルで扱い、生成と編集を分離せずに処理する点が特徴で、GitHub（ali-vilab/VACE）に実装が、Hugging Face（Wan-AI/Wan2.1-VACE-14B）に14Bクラスの重みが公開されている。

ここにSkywork AIのSkyReels V3（SkyworkAI/SkyReels-V3）をマージし、スケルトン（骨格）情報でガイドする構成にしたのが今回のワークフローだ。R2V（Reference-to-Video）、つまり既存動画のモーションを抽出して別の被写体・スタイルで再生成する用途を、ComfyUI系の手元環境で回せる形にまとめている。

読者にとっての含意は三つある。第一に、動画領域でも「公開モデル＋配布ワークフロー」で実装する流れが定着しつつあること。第二に、VACE論文・GitHub・Hugging Face重みという一次情報が揃っており、ワークフローの中身を逆引きで検証できること。第三に、リファレンス動画からの骨格転写は、素材の権利処理とライセンス条件の確認が実装前段で必要になることだ。試す前に各リポジトリのライセンスと、入力素材の利用範囲を切り分けて記録しておきたい。

VACE×SkyReels V3融合｜骨格制御の動画生成WF公開の本文内説明図 — 図解: 骨格で動かし、参照で似せる - VACE×SkyReels V3 マージR2Vワークフローの変換経路と判断点

押さえるポイント

この変化で何が要点か。図解と出典つきで一目で。

VACEとSkyReels V3をマージし骨格誘導R2Vを実現するComfyUI系ワークフロー
VACE論文（arXiv:2503.07598）が示すAll-in-One動画編集の応用例として登場
Wan2.1-VACE-14Bなど公開重みを束ねる「組み合わせ運用」の実装テンプレート

5W1Hでサクッと理解

構造化された事実を最初に。誰が何をいつどこでなぜどのように。

誰が: Civitai投稿者
何を: R2V動画WF公開
いつ: 2026年5月10日
どこで: Civitai
なぜ: 骨格誘導R2V実装
どのように: VACE×SkyReelsマージ

何が起きたか

Civitai上で、VACE（All-in-One動画生成・編集モデル）とSkyReels V3をマージし、スケルトン（骨格）誘導でリファレンス動画から新たな動画を生成するワークフロー「VACE SkyReels V3 R2V Merge Skeleton-Guided Video Workflow」が公開された。

背景

この変化を理解するための前提。

テキストプロンプトのみによる動画生成では、キャラクターの動作を細かく制御することが難しいという課題があった。VACE（Video-Aware Conditioning and Editing）はモーション制御を強化するアプローチとして注目されており、SkyReels は SkyworkAI が開発するオープンソースの動画生成モデルシリーズである。SkyReels V3 は A2V（Audio-to-Video）19B パラメータモデルを含む最新世代であり、Hugging Face でも配布されている。Wan Video 14B はテキスト・画像から動画を生成する大規模モデルで、これらを組み合わせることでより高品質な制御が可能になる。

なぜ今注目なのか

ダンス動画・武道モーション・AIインフルエンサー動画・コスプレ変換など、キャラクターの動きを精密に制御したいクリエイター需要が高まっている。テキストプロンプトに頼らずガイド動画の骨格構造をそのまま転写できる点は、商用コンテンツ制作の効率化に直結する。RunningHub 経由でオンライン実行も可能なため、ローカル環境なしで即試用できる点も普及を後押しする。

3つの視点で読む

技術 / 事業 / 規制 — この変化があなたの判断にどう効くか。

技術への影響

VACEは参照画像・マスク・コントロール信号を統合し動画生成と編集を1モデルで扱う設計で、SkyReels V3とマージしスケルトンガイドを足すことで、ポーズ転写・モーション再利用といったR2V（Reference-to-Video）タスクをオープン重みで構成できる。論文（huggingface.co/papers/2503.07598）と公開リポジトリ（ali-vilab/VACE、SkyworkAI/SkyReels-V3、Wan-AI/Wan2.1-VACE-14B）が揃っており、ローカル実装の再現経路が明確。

市場・事業への影響

Runway Gen-3やKling等のクローズドAPIに対し、Civitaiで配布されるワークフロー＋公開重みの組み合わせは、課金単位ではなくGPU時間でR2Vを回せる選択肢を提示する。素材の社内秘匿が必要な広告・MV制作の現場で、API依存を外す比較対象になる。

規制・リスク

リファレンス動画から骨格を抽出し別キャラクターに転写する用途は、肖像・モーションの権利処理が論点になる。配布元がCivitaiという二次配布が活発なプラットフォームである点も、素材ライセンスの確認を実装前提にする。