Mistralが文書解析の新OCRを投入、欧州主権を訴求
詳細を読む
フランスのAI企業Mistralは2026年6月24日、文書知能モデル「OCR 4」を発表しました。単なる文字抽出にとどまらず、文書全体を構造化データとして返す点が特徴で、各ブロックに位置情報を示す枠、見出しや表といった種別、さらに単語ごとの信頼度スコアを付与します。15カ月でOCR技術の第4世代となり、即日でAPIやAmazon SageMaker、Microsoft Foundryなどから利用できます。
技術上の核心は構造化された出力にあります。従来のように平坦なテキストを並べるのではなく、各ブロックを枠で特定し、タイトルや表、署名などに分類したうえで信頼度を返します。これにより、抽出した事実を元の文書のどこに記載されていたかまで追跡でき、RAGや法令順守の業務で「この数値はどこから来たのか」という監査可能な答えを得られます。
Mistralは独立した評価者による比較で72%の勝率を得たと報告しています。ただし同社自身が採点上の誤差を公開し、集計値は確定的ではなく方向性を示すものだと注意を促しました。公開ベンチマークでは3位という指摘もあり、企業の導入担当者はベンダーの数値に頼らず、自社の文書と言語で独自に評価すべきだと記事は指摘します。
今回の発表は地政学的な追い風の中で行われました。6月12日、米商務省の輸出規制によりAnthropicは最新モデルへのアクセスを全面的に停止させられ、米国外の顧客が突然利用できなくなりました。Mistralが掲げる欧州AI主権の主張は、まさにこの事態で現実味を帯び、自社環境で完結する単一コンテナ提供が製品としての答えになっています。
価格は1000ページあたり4ドルからで、バッチ利用なら2ドルまで下がります。この水準なら10万ページの社内文書も200ドルで処理でき、大規模なデジタル化が現実的になります。一方で前日にはBaiduがMIT licenseの無償モデルを公開しており、自己ホスト型のオープンモデルと、企業向け機能を備えた商用サービスという二つの路線が鮮明になっています。
結局これはOCRの話ではなく、企業向けAI市場への入り口を巡る戦略だと記事は結論づけます。OCR 4はMistralの検索基盤や推論モデル、エージェント基盤へと連なる導線であり、同社は約200億ユーロの評価額での資金調達と2026年に10億ユーロの売上を目指しています。大手や急成長するオープンソース勢に対し、主権と構造化文書知能で欧州企業の予算を取り込めるかが焦点です。