書生?萬象3.5大模型開源：多模態感知領先GPT-5，強化實際應用能力

IP屬地中國·北京 編輯：任飛揚 ITBEAR 時間：2025-09-04 04:06:38

上海人工智能實驗室近期宣布了一項重大進展，其自主研發的通用多模態大模型“書生?萬象”迎來了3.5版本的開源發布。此次升級，不僅強化了模型的推理能力、部署效率，還極大地提升了其通用性能。
在模型規格上，InternVL3.5提供了多達9種不同尺寸的模型供用戶選擇，參數范圍從10億至2410億不等，旨在滿足不同場景下的多樣化需求。尤為旗艦模型InternVL3.5-241B-A28B在多學科推理基準MMMU測試中取得了77.7分的高分，這一成績在開源模型中獨占鰲頭。同時，該模型在多模態通用感知能力上超越了GPT-5，其文本處理能力也領先于其他主流開源多模態大模型。
與上一代產品InternVL3.0相比，InternVL3.5在多個特色任務上實現了顯著提升。特別是在圖形用戶界面（GUI）智能體、具身空間感知以及矢量圖像理解與生成等方面，其性能有了質的飛躍。上海AI實驗室的研究團隊在此次升級中，特別注重強化了模型的實際應用能力，使其在GUI交互、具身空間推理和矢量圖形處理等多個關鍵場景中，實現了從“理解”到“行動”的跨越。
在GUI交互方面，InternVL3.5在ScreenSpot-v2元素定位任務中獲得了92.9分的高分，超越了同類模型。同時，它還支持Windows和Ubuntu系統的自動化操作，并在WindowsAgentArena任務中大幅領先于Claude-3.7-Sonnet。在具身智能體測試中，InternVL3.5展現出了對物理空間關系的深刻理解，并具備規劃導航路徑的能力，在VSI-Bench測試中取得了69.5分的好成績，超過了Gemini-2.5-Pro。在矢量圖形理解與生成方面，InternVL3.5在SGP-Bench測試中刷新了開源紀錄，其生成任務的FID值也優于GPT-4o和Claude-3.7-Sonnet。
InternVL3.5的跨平臺能力同樣令人矚目。它能夠跨Windows、Mac、Ubuntu、Android等多個平臺，識別界面元素并自主執行鼠標、鍵盤操作，實現諸如恢復已刪除文件、導出PDF、郵件添加附件等任務的自動化。這一特性使其在辦公自動化、智能家居等領域具有廣泛的應用前景。
InternVL3.5還具備更強的grounding能力，能夠泛化到全新的復雜且小樣本的具身場景中。配合抓取算法，它支持可泛化的長程物體抓取操作，為機器人的物品識別、路徑規劃與物理交互提供了強有力的支持。這一特性使得InternVL3.5在智能制造、倉儲物流等領域具有巨大的應用潛力。
作為上海AI實驗室書生大模型體系的重要組成部分，InternVL系列一直備受關注。自推出以來，其全系列模型的全網下載量已突破2300萬次。此次InternVL3.5的發布，不僅進一步鞏固了上海AI實驗室在人工智能領域的領先地位，也為推動人工智能技術的普及和應用注入了新的動力。

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

標本制作“神仙打架”！中國動物標本大賽首次在滬舉辦

今日頭條劇透新風向！AI內容過剩時代，“深度”反而更稀缺

今天“世界冥想日”，在這樣的亭子里，AI來幫人類“智造”情緒價值

馬斯克點贊宇樹機器人伴舞視頻

中國首塊L3級自動駕駛專用正式號牌誕生，落戶長安深藍

首發“年度半導體上市公司領航獎”

全站最新

標本制作“神仙打架”！中國動物標本大賽首次在滬舉辦

今日頭條劇透新風向！AI內容過剩時代，“深度”反而更稀缺

今天“世界冥想日”，在這樣的亭子里，AI來幫人類“智造”情緒價值

馬斯克點贊宇樹機器人伴舞視頻

熱門推薦

標本制作“神仙打架”！中國動物標本大賽首次在滬舉辦

今日頭條劇透新風向！AI內容過剩時代，“深度”反而更稀缺

今天“世界冥想日”，在這樣的亭子里，AI來幫人類“智造”情緒價值

馬斯克點贊宇樹機器人伴舞視頻

中國首塊L3級自動駕駛專用正式號牌誕生，落戶長安深藍

首發“年度半導體上市公司領航獎”

王曉剛和他的“世界模型”：一人管十狗，先讓四足機器人上街干活｜智能涌現專訪

在海外賣爆的清閑智能，開始進軍線下，體驗店變身“種草現場”

可靈AI亮相首屆香港國際AI藝術節攜產學研代表探討AI創作新趨勢

SpaceX回應星艦爆炸事件傳聞：報道誤導公眾

華為鴻蒙系統開發者人數突破1000萬

盧偉冰：小米17 Ultra處理器/相機/內存成本上漲非常大

騙了全網流量的“吃豆包”圖背后：AI虛擬內容傳播怎么治？

今日頭條：將“優質深度”確立為2025年核心平臺內容戰略

北京人形開源首個通過具身智能國標測試的具身大模型XR-1