Duix-Avatarは、duixcomがGitHubで公開した完全オフライン動作のAIアバター生成ツールキットである。リポジトリは2026年4月21日時点でスター12,947を集め、主要言語はC。クラウドAPIに依存せず、ローカルGPU1枚で音声からデジタルヒューマン動画を生成できる点が、HeyGenなど月額課金型サービスに対する代替として注目を集めている。
構成はDockerイメージ3種で、fun-asr(音声認識)、fish-speech-ziming(音声合成・クローニング)、duix.avatar(顔・口唇同期)に分かれる。ダウンロード総容量は約70GBに達するため、ストレージは100GB以上が必要となる。推奨環境はIntel Core i5-13400F、メモリ32GB、NVIDIA RTX 4070で、コンシューマー向けGPUで動作する敷居の低さが普及を後押しする。対応言語は英語・日本語・韓国語・中国語・フランス語・ドイツ語・アラビア語・スペイン語の8言語。
意思決定に直結する論点は3つある。第一に、コスト構造の転換。クラウドサブスクから固定費モデルへ切り替える損益分岐点を、生成本数とGPU初期投資で算出できる。第二に、データ保護。顔画像・音声・台本がローカルに留まるため、社内研修・医療・金融など外部送信を避けたい領域で導入余地が広がる。第三に、肖像権・音声クローンの運用ルール。オフラインで複製容易になる分、本人同意の取得記録や利用範囲の定義は利用側で整備する必要がある。読者はまず推奨スペックでの実測値(生成時間、VRAM、口唇同期精度)を1本分計測し、既存サービスと並べて比較材料を揃えることから始めたい。