Googleが、Gboardの新しい音声入力機能「Rambler(ランブラー)」を発表しました。Geminiモデルを活用し、「えーと」「あの」といったフィラーや言い直しを取り除いて、話し言葉をリアルタイムで整った文章に変換する機能です。Android Authorityによると、提供開始は2026年夏が予定されています。

Geminiが「だらだら話」を清書する仕組み

Ramblerは、The Android Show I/O Editionで発表された「Gemini Intelligence」スイートの一部として登場する新機能です。一語一句を忠実に文字起こしするのではなく、話し手が「何を伝えようとしているか」を文脈から判断し、結果として出力されるテキストを磨き上げる点が特徴です。

具体的には、以下のような処理がリアルタイムで行われると説明されています。

  • 「um」「like」といったフィラーワードを文字起こしから除外する
  • 同じ内容を繰り返した場合、重複を整理する
  • 「No, actually, I'll do this instead(やっぱりこっちにする)」のような自己訂正を検知し、訂正前の発言を無視して訂正後の内容のみを残す

従来の音声入力では、フィラーが一つ混ざったり言い直しが発生したりするだけで、結局手動で編集する手間が発生していました。Ramblerはこの「もう一度自分で打ち直したくなる」段階をスキップさせる狙いの機能だと位置づけられています。

Gboardに統合されているため「どこでも使える」

Ramblerが他社の類似機能と比べて優位な点は、Gboard本体に組み込まれていることです。Gboardが動作するすべてのアプリ——Google Messages、Notion、Slackなど——で同じ機能を呼び出せます。

Googleは2026年4月にiOS向けに「Google AI Edge Eloquent」というオンデバイスAIで文字起こしを整形するアプリを公開していましたが、こちらはあくまで単独アプリでした。一方のRamblerはキーボード層に組み込まれているため、アプリを切り替えずに利用できる点で使い勝手に差が出そうです。

なおRamblerはオプション機能であり、利用者が能動的に有効化する形となっています。音声データは保存・蓄積されず、リアルタイム文字起こしのためだけに使われると説明されています。

多言語混在の発話にも対応

Ramblerが採用するGeminiの多言語モデルは、ひとつのメッセージの中で複数言語が混ざっても文脈を理解できるとされています。Googleはブログ投稿で次のように説明しています。

英語とヒンディー語、あるいはその他の組み合わせを混ぜて話していても、Ramblerが文脈とニュアンスを理解し、メッセージがあなたらしく、それでいてより洗練されたものになるよう仕上げます。

日本語と英語を混ぜながら話す場面でも応用が効きそうな機能ですが、日本語の対応状況についてはソースに具体的な記載はありません。

提供開始時期と対象端末

Ramblerを含むGemini Intelligenceスイートは、2026年夏に提供開始予定とされています。最新のSamsung GalaxyおよびGoogle Pixel端末が最初の対象となる見込みで、次世代Galaxy foldablesや噂されているPixel 11シリーズも含まれる可能性があると報じられています。

Android Authorityが実施した読者投票(176票)では、Gemini Intelligence機能への期待について以下のような結果が示されています。

回答割合
期待している51%
まだ分からない22%
興味なし27%

過半数が肯定的に受け止めている一方、4分の1強が興味を示していない点は、AI機能の押し付けに対する一定の警戒感も読み取れる結果です。

実際に使える形になるまでにはまだ数か月あります。現時点では「対応端末を持っているユーザーは2026年夏のアップデートを待つ」のが妥当な判断と言えるでしょう。日本語での挙動については、提供開始後の検証を待つ必要があります。

Gemini Intelligenceスイートに同時搭載される他の新機能

Ramblerは単独で発表されたわけではなく、Gemini Intelligenceという包括的なAI機能群の一部として登場しました。あわせて発表された主要機能は次のとおりです。

  • Create My Widget: 自然言語のプロンプトを入力するだけで、AndroidおよびWear OS向けのカスタムウィジェットを生成できる機能です。
  • Auto Browse(Chrome on Android): 6月後半からChrome on AndroidにGeminiが導入され、Auto Browseが予約などのタスクをユーザーに代わって実行します。
  • Autofill with Google強化: GeminiのPersonal Intelligenceと連携することで、従来の定型項目を超えた複雑なフォームの自動入力にも対応します。

デザイン面ではMaterial 3 Expressiveを土台にした新しいデザイン言語が採用され、Gemini Intelligence全体で統一感のある体験が提供されています。さらにGoogleは、こうしたGemini Intelligence機能を年内にスマートウォッチ、自動車、スマートグラス、ノートPCへと拡大していく方針を示しており、スマートフォンの枠を超えたエコシステム全体でのAI統合が進む見通しです。

ディクテーション市場とプライバシー処理への影響

Ramblerの登場は、近年活況だった音声入力系スタートアップにとって大きな転換点と受け止められています。これまでディクテーション市場はデスクトップとiOSが中心で、Androidは手薄な状態が続いていました。その間隙を縫う形でWispr Flow、Willow、Superwhisperといったディクテーション系スタートアップが台頭してきましたが、TechCrunchはこれらのサービスがRamblerの登場で脅威に直面していると指摘しています。

GboardはAndroidの事実上の標準キーボードであり、数億人規模のユーザーにプリインストールされた状態で届く

Google社内でも自信は強く、ブリーフィングで同社はRamblerを「キーボードの再発明」と表現しています。プライバシー面については、オンデバイス処理とクラウド処理を組み合わせることで安全性とプライバシーを担保すると説明されています。サードパーティ製アプリが単一の処理形態に依存しがちであるのに対し、Gboardはハイブリッドな処理基盤を活用できる点が差別化要因となりそうです。

Q&A

Q. Ramblerは無料で使えますか? Gboardに統合される機能として発表されており、追加料金についての言及はソースにありません。Gemini Intelligenceスイートの一部として提供されます。

Q. 音声データはGoogleに保存されますか? 保存されないと説明されています。音声はリアルタイム文字起こしのためだけに使われ、蓄積はされないとされています。

Q. iPhoneでも使えますか? RamblerはGboard(Android)向けの機能です。iOS向けには別途、2026年4月に公開された単独アプリ「Google AI Edge Eloquent」が存在します。

出典