音声を即翻訳。70言語対応のGemini 3.5 Live Translate

AI TREND

Google：音声翻訳機能を発表

Googleが、音声をその場で自然に双方向翻訳する「Gemini 3.5 Live Translate」を発表し、あわせて「Google翻訳」に最新世代のGemini翻訳能力を導入して対応言語と精度を拡張した。

3 の要点を3分で

Googleが音声をその場で双方向に翻訳する機能「Gemini 3.5 Live Translate」を発表した。公式発表では70以上の言語、2,000以上の言語の組み合わせに対応し、騒がしい環境でも自然な翻訳音声を返し、話者と同期して遅延が少なく、話されている言語を自動検出する。あわせて20年の歴史を持つ「Google翻訳」に最新世代のGemini翻訳能力を導入し、対応言語と精度を拡張した。

音声処理を担うモデル「Gemini 3.5 Audio」のモデルカード（仕様書）も公開済みで、業務にどのモデルを組み込むかを判断する一次情報の起点になる。対話アシスタント「Gemini Live」は過去に40以上の言語へ対応を広げており、今回はこれらの音声・翻訳機能をGemini 3.5系へ更新する位置づけだ。

音声をその場で双方向に翻訳する機能は、海外出張や多言語のオンライン会議、接客などの現場利用に直結する。対応言語ペアが自社の使い方に含まれるか、遅延や環境の前提が成り立つかを、公式のモデルカードを起点に確かめる作業が採用判断の入口になる。

音声を即翻訳。70言語対応のGemini 3.5 Live Translateの本文内説明図 — 図解: 音声翻訳機能を発表 - Googleが音声をその場で自然に双方向翻訳するGemini

押さえるポイント

この変化で何が要点か。図解と出典つきで一目で。

70以上の言語、2,000以上の言語の組み合わせに対応する音声翻訳
騒がしい環境でも自然な翻訳音声を返し、話者と同期して遅延が少ない
話されている言語を自動検出し、双方向の会話翻訳に対応

5W1Hでサクッと理解

構造化された事実を最初に。誰が何をいつどこでなぜどのように。

誰が: Google
何を: 音声翻訳機能を発表
いつ: 2026年6月10日
どこで: 公式ブログ
なぜ: 現場の通訳需要
どのように: Gemini 3.5 Audio

背景

Googleは長年「Google翻訳」を提供しており、すでに20年の歴史を持つ。近年は同社の生成AI「Gemini（ジェミニ）」を翻訳や音声処理に取り込み、対話アシスタント「Gemini Live」では40以上の言語に対応を広げてきた。今回の発表は、これらの音声・翻訳機能を最新世代モデル「Gemini 3.5」系へ更新するものである。公式情報によれば、70言語・2,000以上の言語の組み合わせに対応するとされる。

なぜ今注目なのか

音声をその場で双方向に翻訳する機能は、海外出張や多言語のオンライン会議、接客などの現場利用に直結する。対応言語数と言語の組み合わせが大幅に増えたことで、これまで対応が薄かった言語間でも実用的な通訳が見込める。翻訳ツールを業務に組み込む企業にとって、どのモデルを採用するかの判断材料になる。

音声をその場で双方向翻訳する「Live Translate」

Googleが「Gemini 3.5 Live Translate」を発表した。音声をその場で自然な音声に翻訳する機能で、公式発表によれば70以上の言語、2,000以上の言語の組み合わせに対応する。発表を取り上げた信頼できる開発者向けキュレーターの投稿は、特徴を端的にこうまとめている。

Gemini 3.5 Live Translate! We just shipped a real-time babel fish. 70+ languages, 2,000+ language pairs. Natural translated speech, works in noisy environments. Stays in sync with the speaker, no lag, no awkward pauses. Auto-detects the language being spoken.
出典: Gemini 3.5 Live Translate 発表投稿

ここで言う「real-time babel fish（リアルタイム翻訳機）」とは、話した言葉をその場で別の言語の音声に変える仕組みのことだ。投稿が挙げた要点は、自然な翻訳音声を返すこと、騒がしい環境でも動くこと、話者と同期して遅延や不自然な間が出ないこと、話されている言語を自動で検出することの4点になる。これらは録音してから処理する従来型と違い、会話のテンポを保ったまま通訳する用途を想定している。

Google翻訳への最新能力導入とモデルカード公開

今回の発表は単独の新機能にとどまらない。Googleは20年の歴史を持つ「Google翻訳」に最新世代のGemini翻訳能力を導入し、対応言語と精度を拡張したと公表した。対話アシスタント「Gemini Live」は過去に40以上の言語へ対応を広げており、今回はこれらの音声・翻訳機能をGemini 3.5系へ更新する位置づけになる。

音声処理を担うモデル「Gemini 3.5 Audio」のモデルカード（仕様書）も公開済みだ。モデルカードとは、対応範囲や前提条件などモデルの仕様をまとめた公式文書を指す。