近日,谷歌對其人工智能模型Gemini 1.5進行了一系列升級,推出了Gemini-1.5-Pro-002和Gemini-1.5-Flash-002兩個新版本。并且特別針對Gemini 1.5 Flash模型進行了優化,使其AI聊天的響應速度最高提升了50%。這一改進是通過減少延遲實現的,旨在為用戶提供更加流暢和高效的體驗。
谷歌還升級了8月發布的Gemini 1.5實驗模型,推出了Gemini-1.5-Flash-8B-Exp-0924升級版,進一步增強了文本和多模態應用的能力。
用戶可通過Google AI Studio、Gemini API和Vertex AI(面向Google Cloud客戶)訪問新的Gemini模型。此外,針對Gemini Advanced用戶的Gemini 1.5 Pro-002聊天優化版也即將推出。
谷歌對新版本模型進行了成本優化,顯著降低了token輸入和輸出的費用。新模型的費用最高可減少50%,同時提高了速率限制,減少了延遲。這一新定價策略將于2024年10月1日開始實施。

多項基準測試中,新版本模型展現出更強的性能,具體表現在:
在MMLU-Pro基準測試中,性能提升了約7%;
在MATH和HiddenMath基準測試中,數學性能提升了20%;
視覺理解和Python代碼生成評估中,性能提升了2-7%。





京公網安備 11011402013531號