Microsoftは開発者向けイベントMicrosoft Buildで、Azure Translatorの文書翻訳機能を拡張し、いずれも一般提供(GA)を開始したと発表した。最大の変化は、翻訳対象が「文字」から「画像を含む文書全体」へ広がった点にある。

具体的には、画像ファイルを直接翻訳しレイアウトを保ったまま即時に返す同期翻訳、大量の画像を一括処理するバッチ翻訳がGAになった。バッチ処理では画像をPDFへ変換する前処理が不要になった。PDFのバッチ翻訳はAzure AI Document Intelligenceを使い、表や脚注、多段組みのレイアウト再現を改善した。WordやPowerPoint内の画像に埋め込まれた文字も文書本文と一緒に翻訳できる。

さらに技術文書向けの構造化フォーマットXML DITAXLIFF 2.0に同期・非同期の両方で対応し、翻訳結果を後処理なしで既存の制作工程へ戻せる。製品カタログやスキャン文書、技術仕様書をそのまま多言語化でき、リアルタイム処理は顧客サポートやプレビュー、バッチ処理はアーカイブやデータセット向けと用途を分けて使える。