中国のOpenDataLabが開発する文書解析エンジンMinerUが、GitHubで1日あたり524スター増のペースで急上昇している(総スター数69,101)。PDF・Word・PowerPoint・Excel・画像・Webページを、生成AIが扱いやすい構造化Markdown/JSONへ変換するOSSだ。
視覚言語モデル(VLM)とOCRの2エンジン構成で109言語に対応し、数式をLaTeX、表をHTMLへ変換、ページをまたぐ表の結合も扱う。バージョン3.4ではOmniDocBench v1.6基準でOCR精度が約11%向上、処理速度が約100%(約2倍)高速化した。
実務上の転機はライセンス変更で、AGPLv3からApache 2.0ベースの独自ライセンスへ変わり商用導入の障壁が下がった。完全オフラインで動作しCPUのみでも使え、Ascendなど中国製AIチップ10種以上に対応する。社内文書を外部に出せない環境でのRAG構築において、自前運用の有力な選択肢になっている。