7 月 19 日消息,商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛 17 日宣布,商湯絕影在行業(yè)內(nèi)率先實(shí)現(xiàn)了原生多模態(tài)大模型的車端部署。車載端側(cè) 8B 模型首包延遲在 300 毫秒以內(nèi),推理速度 40 Tokens / 秒,覆蓋主流算力平臺(tái)。

商湯絕影為多模態(tài)大模型打造計(jì)算引擎“HyperPPL”,目前擴(kuò)展并支持主流車載計(jì)算硬件,兼容多種主流操作系統(tǒng),適配多個(gè)車載芯片的部署平臺(tái)。
商湯絕影稱 HyperPPL 針對(duì)車載多人場景進(jìn)行優(yōu)化,使得車內(nèi)多人并發(fā)情況下,車端多模態(tài)大模型的模型推理效率相比單人沒有明顯降低。
據(jù)IT之家此前報(bào)道,商湯絕影此前表示,深圳首條自動(dòng)駕駛公交線路采用其車輛與技術(shù),所有駕駛操作都無需人員介入。
明年上千 TOPS 算力的車載芯片(英偉達(dá) Thor)就會(huì)問世。基于更高算力的計(jì)算平臺(tái),商湯預(yù)計(jì)絕影多模態(tài)大模型車端部署方案的首包延遲將大幅降低,推理速度進(jìn)一步提高。





京公網(wǎng)安備 11011402013531號(hào)