OpenBMBが、端末上で動くことを狙った小型のマルチモーダルAI「MiniCPM-V」シリーズを公開・更新した。最新版MiniCPM-V 4.6はHugging Faceで配布され、誰でも入手して試せる。画像・動画・テキストをまとめて扱えるモデルで、クラウドの大規模モデルに頼らず端末側で推論を完結できる構成が特徴だ。
同社はXで、開発者が性能比較テストの枠を超え、鉱山現場・実験室・企業の文書レビュー・コードパイプラインといった実運用ワークフローでモデルを使い始めたと報告した。速度・低コスト・実用十分な精度を必要とする現場に収まり始めた点が転換点となる。
配布物はモデル単体にとどまらない。ネット接続なしで完結する対話アプリ「MiniCPM-V-Apps」や、端末向け小型言語モデル「MiniCPM5-1B」も提供されている。クラウドへデータを送らず処理できるため、通信コストや機密性の制約が厳しい現場でも、課金前に自前環境で実務適合性を確かめられる。
We’re excited to see developers exploring practical multimodal workflows beyond benchmarks🎉 From mine sites and lab counters to enterprise document review and code pipelines — the model is finding its place in production workflows that need speed, low cost, and good-enough…