![]()
![]()
新民晚報記者今天從大模型獨角獸階躍星辰獲悉,其于11月29日開源GELab-Zero,首次將GUI Agent模型與完整配套基建同步開放,支持“手搓黨”一鍵部署。其中4B GUI Agent模型在手機端、電腦端等多個GUI榜單上全面刷新同尺寸模型性能紀錄,取得SOTA(最先進水平)成績。此外,階躍星辰還開源了基于真實業務場景的自建評測標準AndroidDaily,以期推動GUI領域模型評測向消費級、規模化應用發展。目前,企業級用戶和開發者已經可以通過GitHub和HuggingFace平臺體驗GELab-Zero。
階躍星辰在ScreenSpot、OSWorld、MMBench、Android World多個開源基準測試上對GELab-Zero-4B-preview模型進行了全面評估,涵蓋了GUI理解、定位、交互等多個維度。測試結果顯示,GELab-Zero-4B-preview在多項權威開源基準測試中超越其他主流模型,拿下同尺寸SOTA。同時,GELab-Zero-4B-preview的表現還超越了參數量更大的GUI-Owl-32B等模型,性能更優也更易部署。
![]()
![]()
階躍星辰官方介紹,GELab-Zero提供一鍵拉起即可獲得類似開源GUI Agent MCP的體驗,在本地即可完成部署,并將推理鏈路完全掌控在自己手里。就具體能力而言,GELab-Zero可支持4B量級模型在消費級硬件上運行,兼顧低延遲與隱私;與此同時,它還支持一鍵式多終端部署,能自動處理環境依賴和設備管理;可以分發到多臺手機并記錄交互軌跡,實現可觀測、可復現;并支持多模態智能體范式:涵蓋ReAct閉環、多智能體協作以及定時任務等多種工作模式。
![]()
在官方公布的應用場景示例中,GELab-Zero可以很好地執行復雜任務和模糊指令,譬如能夠精準地完成一次跨品類、涉及不同商品規格和數量的采購,也可以在接到“經典電影”“適合遛娃的地方”這類模糊和有主觀色彩的需求時,自行判斷執行標準并順利完成任務。
據了解,階躍星辰研發GELab-Zero的初衷,是解決GUI Agent面臨的諸多工程側難題——由于移動端應用生態極其碎片化,GUI Agent在不同品牌、型號設備上運行時場景會在多設備ADB連接、依賴安裝、權限配置、推理服務上線、任務編排與回放等方面出現工程問題,這意味著Agent開發者與MCP用戶需要處理諸多工程基建工作,難以將精力集中于策略創新。
此前,階躍星辰曾在2025世界人工智能大會期間公開展示了“一鍵執行助手”AI手機解決方案。接入該方案后,手機Agent助手可以基于用戶指令自主執行包括追星打卡、點外賣、預約掛號、地圖導航、繳納社保、預訂機票酒店、寫朋友圈文案等各種任務,讓手機Agent助手的能力從“能對話”延展到“會干活”,進一步成為人類智慧伴生體。
原標題:《階躍星辰開源4B模型,本地輕松部署,在你的手機上飛速跑GUI任務!》
欄目編輯:陸梓華 題圖東方IC 階躍星辰
作者:新民晚報 郜陽





京公網安備 11011402013531號