2026-04-04 19:58:44
1

Google 推出 Gemini 3.1 Flash-Lite,輸入成本僅為 Pro 的 1/8,並在 6 項基準測試中表現優於 GPT-5 Mini 和 Claude 4.5 Haiku

摘要

BlockBeats 消息,3 月 4 日,谷歌發布 Gemini 3.1 Flash-Lite 預覽版,定位為 Gemini 3 系列中速度最快、成本最低的模型。該模型基於 Gemini 3 Pro 架構,採用混合專家(MoE)設計,僅激活部分參數以降低推理成本。API 定價為輸入 $0.25/百萬 token、輸出 $1.50/百萬 token,分別為 Gemini 3.1 Pro($2/$18)的約 1/8。


在性能方面,與 Gemini 2.5 Flash 相比,首個 token 延遲縮短 2.5 倍,輸出速度提升 45%,達到每秒 363 token。支援最大 100 萬 token 輸入和 6.4 萬 token 輸出,接受文字、圖片、音訊和影片輸入。在 11 項內部基準測試中,Flash-Lite 在 6 項上超越 GPT-5 mini 和 Claude 4.5 Haiku,GPQA Diamond(博士級科學問答)達 86.9%,MMMU-Pro(多模態推理)76.8%,LiveCodeBench(代碼生成)72.0%。


該模型內置可調的「思考級別」(thinking levels),開發者可在 AI Studio 和 Vertex AI 中控制模型的推理深度,以在高頻場景中平衡品質與成本。目前透過 Gemini API(Google AI Studio)和 Vertex AI 提供預覽版存取。

声明:文章不代表币圈子观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!转载请注明出处!侵权必究!
回顶部