3 月 10 日消息,谷歌公司于 3 月 7 日發布博文,宣布推出 Gemini Embedding,是一款基于 AI 的文本處理模型,現已集成至 Gemini API。
該模型在 Massive Text Embedding Benchmark(MTEB)中拔得頭籌,超越了 Mistral、Cohere 和 Qwen 等競爭對手,成為當前性能最強的文本嵌入模型。
Gemini Embedding 將文本轉換為數值表示(向量),從而支持語義搜索、推薦系統和文檔檢索等功能。它在 MTEB 基準測試中表現出色,平均任務得分為 68.32,顯著高于 Linq-Embed-Mistral 和 gte-Qwen2-7B-instruct 等模型,達到 State-of-the-art。

State-of-the-art(SOTA)AI 模型是指在特定任務或領域中,當前表現最優的模型或方法。這些模型通常通過在各種基準測試中取得最高分來證明其優越性,并且往往在準確性、效率或能力上超越了之前的模型,甚至在某些任務中達到了人類水平的表現。
該模型在配對分類上得分為 85.13;在檢索上得分 67.71,在重排序得分為 65.58,表明 Gemini Embedding 在 AI 搜索引擎、文檔分析和聊天機器人優化等實際應用中具有顯著優勢。
MTEB 由 Hugging Face 創建,通過 50 多個數據集評估 AI 模型在文本數據排名、分類和檢索方面的能力。作為行業標準,MTEB 排行榜為企業在選擇 AI 模型時提供了重要參考。Gemini Embedding 的優異表現不僅鞏固了谷歌在 AI 領域的領導地位,也為其在商業應用中的推廣奠定了基礎。
Gemini Embedding 的高性能使其在以下領域具有廣泛的應用前景:
搜索引擎:提升搜索結果的相關性,支持谷歌正在測試的純 AI 驅動搜索模式。
多語言應用:增強跨語言翻譯、客戶服務自動化和內容排名能力。
企業服務:優化基于 Google Cloud 的 AI 分析、語義搜索和自動化數據檢索功能。





京公網安備 11011402013531號