Google 於 4 月 6 日在 iOS 平台推出實驗性語音輸入應用 Google AI Edge Eloquent,主打離線運行與智能文本潤色。應用搭載自研 Gemma4 系列 ASR 模型(E2B/E4B 規格),支援本地語音轉文字、自動過濾語氣詞及重複修正,並提供要點/正式/簡短/完整四種文本風格轉換。用戶可選擇啟用雲端 Gemini 模型進行深度清理,並導入 Gmail 聯絡人與術語建構個性化詞表。應用目前免費且無訂閱限制,顯著區別於年費 85 美元的競爭對手 SuperWhisper。Android 版本已列入開發計畫,未來將支援系統鍵盤整合與浮動操作。此舉標誌著 Google 在邊緣 AI 語音處理領域的實質性落地,凸顯 Gemma 模型在行動端輕量化部署的技術能力。
文章作者、來源:AIBase
當地時間4月6日(週一),谷歌在 iOS 平台低調上線了一款名為 “Google AI Edge Eloquent” 的實驗性語音輸入應用。該應用主打“離線優先”與“智能潤色”,旨在利用邊緣側 AI 技術,將自然的口語實時轉化為專業、精煉的文本。此舉標誌著谷歌正式切入由 Wispr Flow 和 SuperWhisper 領跑的高端 AI 語音轉文字賽道。
核心技術與功能亮點:
Eloquent 搭載了谷歌最新發布的 Gemma4 系列(E2B/E4B 規格)自動語音識別(ASR)模型。該模型支援完全離線運行,用戶在下載模型包後即可實現本地轉錄,有效保障隱私並降低延遲。應用具備強大的「智能去雜」功能,能自動識別並過濾「嗯」、「啊」等語氣詞及重複修正,輸出邏輯連貫的文本。
產品深度集成與互動:
- 多模態風格轉換:提供「要點」、「正式」、「簡短」和「完整」四種文本處理模式。
- 雲端協同(可選):開啟雲模式後,應用將調用雲端 Gemini 模型進行深層文本清理。
- 個性化語境:支援從 Gmail 導入用戶專屬的關鍵詞、人名及術語,並允許建立自定義詞彙表。
- Productivity Stats: Real-time display of dictation word count, words per minute (WPM), and historical session records.
市場策略與未來佈局:
目前該應用在 iOS App Store 免費提供,無訂閱費或使用限制,對比每年收費 85 美元的 SuperWhisper 等競爭對手具有極強衝擊力。儘管首發於 iOS,但官方描述已確認 Android 版本的開發計劃,並預告將支援系統級鍵盤整合及類似 Wispr Flow 的浮動按鈕功能。作為 Google AI Edge 品牌下的重要成員,Eloquent 的發布不僅是工具類應用的嘗試,更是谷歌展示 Gemma 模型在行動端部署能力的標竿案例。