11月18日,澎湃新聞記者獲悉,微博正式發布首個自研開源大模型VibeThinker,這個僅擁有15億參數的“輕量級選手”,在國際頂級數學競賽基準測試上擊敗了參數量是其數百倍的,高達6710億的DeepSeek R1模型。
據悉,VibeThinker單次“后訓練”的成本僅7800美元,對比DeepSeek-R1和MiniMax-M1等成本直接降低了幾十倍。
需要說明的是,VibeThinker目前發布的版本尚處于實驗性版本,其研發重點主要集中于極大強化小模型復雜數學與競賽編程等方面的能力,其在日常聊天等能力還沒有做過針對性訓練優化,所以暫不適合作為日常聊天工具進行互動,更適用于數學和代碼等高智能應用場景。(澎湃新聞記者 吳雨欣)





京公網安備 11011402013531號