Google 推出 Gemini 3.1 Flash-Lite，輸入成本僅為 Pro 的 1/8，並在 6 項基準測試中表現優於 GPT-5 Mini 和 Claude 4.5 Haiku-萌币圈网-手机赚钱软件推荐

Google 推出 Gemini 3.1 Flash-Lite，輸入成本僅為 Pro 的 1/8，並在 6 項基準測試中表現優於 GPT-5 Mini 和 Claude 4.5 Haiku

摘要

BlockBeats 消息，3 月 4 日，谷歌發布 Gemini 3.1 Flash-Lite 預覽版，定位為 Gemini 3 系列中速度最快、成本最低的模型。該模型基於 Gemini 3 Pro 架構，採用混合專家（MoE）設計，僅激活部分參數以降低推理成本。API 定價為輸入 $0.25/百萬 token、輸出 $1.50/百萬 token，分別為 Gemini 3.1 Pro（$2/$18）的約 1/8。

在性能方面，與 Gemini 2.5 Flash 相比，首個 token 延遲縮短 2.5 倍，輸出速度提升 45%，達到每秒 363 token。支援最大 100 萬 token 輸入和 6.4 萬 token 輸出，接受文字、圖片、音訊和影片輸入。在 11 項內部基準測試中，Flash-Lite 在 6 項上超越 GPT-5 mini 和 Claude 4.5 Haiku，GPQA Diamond（博士級科學問答）達 86.9%，MMMU-Pro（多模態推理）76.8%，LiveCodeBench（代碼生成）72.0%。

該模型內置可調的「思考級別」（thinking levels），開發者可在 AI Studio 和 Vertex AI 中控制模型的推理深度，以在高頻場景中平衡品質與成本。目前透過 Gemini API（Google AI Studio）和 Vertex AI 提供預覽版存取。

声明：文章不代表币圈子观点及立场，不构成本平台任何投资建议。投资决策需建立在独立思考之上，本文内容仅供参考，风险自担！转载请注明出处！侵权必究！