Mistral AI が2026年6月23日、文書読み取りモデル「OCR 4」を公開した。抽出した文字に加え、各要素の位置を示す枠(バウンディングボックス)、見出し・表・数式・署名などの種別分類、ページ単位・単語単位の確信度を併せて返す。170言語・10言語グループに対応し、低リソース言語でも性能が出るとされる。
位置情報は最も要望が多かった機能で、墨消し(マスキング)・引用元の明示・人手による確認を組み合わせた業務に直結する。1つのコンテナで自社環境内に完結して運用でき、企業向けに自己管理型導入を提供するため、文書を社外に出さずデータ主権・規制対応を満たしつつ大量処理できる。検索/RAG基盤「Search Toolkit」の取り込み部品として統合される。
公開ベンチマーク OlmOCRBench で総合85.20、独立評価者の選好で平均勝率72%。API料金は1,000ページあたり4ドル(一括処理割引で2ドル)で、比較対象の Document AI の5ドルより低い水準が示され、精度とコストの両面で比較材料がそろった。