Civitai投稿者:骨格誘導動画WF公開
画像: AI生成

Civitaiで公開された「VACE SkyReels V3 R2V Merge Skeleton-Guided Video Workflow」は、リファレンス画像のキャラ同一性を保ったまま、ガイド動画の骨格構造に沿って新しい動画を生成するComfyUI向けワークフローだ。ベースモデルはWan Video 14B t2vで、VACEとSkyReels V3の構成要素を組み合わせている。

処理フローはモデルカードに具体的に記載されている。VHS_LoadVideoがガイド動画を読み込み、フレーム・幅・高さ・フレーム数・音声情報を抽出してパイプラインへ渡す。ImageResizeKJv2とImageResize+でリファレンス画像とガイド動画の寸法を揃え、UMT5スタイルのテキストエンコード、ポジティブ/ネガティブ条件付け、KSampler、Wan VAEデコードを経て、VHS_VideoCombineがMP4として出力する。ネガティブプロンプトは手足の破綻、解剖学的不安定さ、ちらつき、低品質、モーション不整合といった動画特有のアーティファクト抑制に使われる。

価値の中心は、テキストだけでアクションを発明させるのではなく、ガイド動画を「動きの構造」として与える点にある。モデルカードはダンス、武道モーション、キャラクターパフォーマンス、スタイライズドアニメーション、AIインフルエンサー動画、コスプレ変換、ゲームキャラのモーションテスト、シネマティック・ショート動画を用途として明示している。

配布面では、RunningHub上のオンライン実行リンク(招待コード付き)と、4090級・48GBの計算資源、新規登録1000ポイントなどの導線が用意される。中国語圏向けにBilibili動画と夸克網盤での補助資料も案内されている。日本のクリエイターにとっては、ローカル環境構築なしで骨格誘導型生成を実機検証できる選択肢が一つ増えた格好で、リファレンス画像とガイド動画それぞれの権利確認運用をどう設計するかが実装前の論点になる。