Jina AI創立于2020年,總部位于德國柏林,主要從事提示工程和嵌入模型業務,已迅速成長為多模態AI領導者。Jina AI積極推動開源和開放研究,致力于彌合先進AI理論與開發者及數據科學家構建的AI驅動型真實世界應用程序之間的差距。目前,Jina AI平臺已擁有超過40萬名注冊用戶。
Jina AI創始人兼CEO肖涵博士在闡述公司使命時表示:“我們希望能夠為多模態AI未來的實現鋪平道路。我們發現當前的機器學習和軟件生態系統在處理多模態AI方面面臨著一些挑戰。鑒于此,我們鼎力研發開創性工具和平臺,助力企業和開發者解決這些復雜問題。我們的愿景是發揮自身的關鍵作用,幫助全球用戶充分利用多模態AI的巨大潛力并徹底改變信息的解讀和互動方式。”
Jina AI在嵌入模型領域的研究引起了業界的廣泛興趣和關注。因為如今許多開發者都已認識到嵌入技術對于生成式AI的重要意義。嵌入模型是非常復雜的算法,可以將任意結構的數據轉化并嵌入到多維數字編碼(即向量)中。這些向量通過捕捉數據的模式和關系來賦予數據相應的語義信息。這意味著,我們可以使用與結構化業務數據相同的方式來分析和搜索非結構化數據。考慮到我們每天生成的數據中有80%以上是非結構化數據,我們開始對嵌入模型與MongoDB AtlasVector Search等先進解決方案相結合對生成式AI帶來的變革性影響充滿期待。
Jina AI推出的jina-embeddings-v2是目前首個開源8K文本嵌入模型。該模型的標記長度達到8K,這使其能夠更深入地理解上下文,從而顯著提高檢索增強生成(RAG)和語義搜索等任務的準確性和相關性。Jina AI的嵌入模型具有增強型數據索引和搜索能力,并支持雙語環境。嵌入模型專注于單一語言和語言對,確保在特定語言基準測試中達到最先進的性能。Jina Embeddings v2目前已經發布了德語-英語和漢語-英語的雙語模型,其他雙語模型正在開發中。
Jina AI的嵌入模型在分類、重排、檢索和摘要等方面均有優異表現,因此適用于各種應用場景,尤其是跨語言任務。近期,該嵌入模型在跨國企業客戶中的部分應用案例包括: 銷售序列自動化、人力資源技能匹配以及附帶欺詐檢測功能的付款對賬等。

肖涵博士表示:“我們的嵌入API能夠原生集成生成式AI開發者堆棧中的關鍵技術,包括MongoDB Atlas、LangChain、LlamaIndex、Dify和Haystack。MongoDB Atlas將應用程序數據和向量嵌入整合至一個統一的平臺,使兩者之間完全保持同步。每當數據庫中加入新的數據或更新已有數據時,Atlas Triggers都會調用嵌入API,以確保嵌入始終保持最新狀態。這種集成式方法使開發者能夠更加高效地為企業構建全新的前沿AI驅動型應用程序。”
如需開始使用MongoDB和Jina AI,請注冊MongoDB Atlas并閱讀操作指南。如果您的團隊正在構建AI應用程序,歡迎報名參加AI創新者計劃。報名成功的公司可以獲得免費的Atlas學分和技術扶持,并與更廣泛的AI生態系統建立聯系。





京公網安備 11011402013531號