7 月 19 日消息,商湯科技聯合創始人、首席科學家王曉剛 17 日宣布,商湯絕影在行業內率先實現了原生多模態大模型的車端部署。車載端側 8B 模型首包延遲在 300 毫秒以內,推理速度 40 Tokens / 秒,覆蓋主流算力平臺。

商湯絕影為多模態大模型打造計算引擎“HyperPPL”,目前擴展并支持主流車載計算硬件,兼容多種主流操作系統,適配多個車載芯片的部署平臺。
商湯絕影稱 HyperPPL 針對車載多人場景進行優化,使得車內多人并發情況下,車端多模態大模型的模型推理效率相比單人沒有明顯降低。
據此前報道,商湯絕影此前表示,深圳首條自動駕駛公交線路采用其車輛與技術,所有駕駛操作都無需人員介入。
明年上千 TOPS 算力的車載芯片(英偉達 Thor)就會問世。基于更高算力的計算平臺,商湯預計絕影多模態大模型車端部署方案的首包延遲將大幅降低,推理速度進一步提高。





京公網安備 11011402013531號