Googleが音声をその場で双方向に翻訳する機能「Gemini 3.5 Live Translate」を発表した。公式発表では70以上の言語2,000以上の言語の組み合わせに対応し、騒がしい環境でも自然な翻訳音声を返し、話者と同期して遅延が少なく、話されている言語を自動検出する。あわせて20年の歴史を持つ「Google翻訳」に最新世代のGemini翻訳能力を導入し、対応言語と精度を拡張した。

音声処理を担うモデル「Gemini 3.5 Audio」のモデルカード(仕様書)も公開済みで、業務にどのモデルを組み込むかを判断する一次情報の起点になる。対話アシスタント「Gemini Live」は過去に40以上の言語へ対応を広げており、今回はこれらの音声・翻訳機能をGemini 3.5系へ更新する位置づけだ。

音声をその場で双方向に翻訳する機能は、海外出張や多言語のオンライン会議、接客などの現場利用に直結する。対応言語ペアが自社の使い方に含まれるか、遅延や環境の前提が成り立つかを、公式のモデルカードを起点に確かめる作業が採用判断の入口になる。