
大模型上車,是智能汽車下半場的關(guān)鍵抓手。
2024年10月24日,第七屆世界聲博會暨2024科大訊飛全球1024開發(fā)者節(jié)成功舉辦,會上煥新了訊飛星火大模型的底座能力。
其中,訊飛星火在汽車行業(yè)的落地,令外界尤為關(guān)注。
當(dāng)前訊飛星火大模型已落地六大車企量產(chǎn)車,率先開啟大模型落地汽車場景的步伐。本屆大會上發(fā)布的星火多語言大模型、端側(cè)星火大模型,有望進(jìn)一步推動大模型在汽車場景落地,并加速中國汽車的出海戰(zhàn)略。
首發(fā)語音視覺虛擬人交互“三合一”,打開汽車交互想象空間
訊飛星火,越來越能打了。
國內(nèi)外14項(xiàng)主流中英文測試集中,正式發(fā)布的訊飛星火4.0 Turbo,在其中9項(xiàng)測試集中實(shí)現(xiàn)超越。

更為重要的是,科大訊飛首發(fā)多模態(tài)視覺和超擬人數(shù)字人,在多模態(tài)上又往前邁出一大步,從現(xiàn)場生動的交互和逼真的超擬人交互來看,星火為大模型的落地打開了新的想象空間。
大模型時代,訊飛星火看到了萬物互聯(lián)和傳統(tǒng)人機(jī)交互場景重構(gòu)的機(jī)遇,在遠(yuǎn)場高噪、全雙工、多語種多方言能力上,在業(yè)界率先推出了語音視覺虛擬人交互“三合一”,多模態(tài)視覺、超擬人數(shù)字人正重新定義萬物智聯(lián)時代的多模AIUI交互標(biāo)準(zhǔn)。
超擬人數(shù)字人,說話不再是冷漠的朗讀腔,而是宛如真人般親切,可輕松識別外部信息,情景感知能力更為全面,實(shí)現(xiàn)語音、視頻、圖文的全部聯(lián)動的多模態(tài)交互。
科大訊飛研究院院長劉聰現(xiàn)場和超擬人數(shù)字人玩了個“角色扮演”游戲,無論是扮演孫悟空還是小豬佩奇,數(shù)字人反應(yīng)都惟妙惟肖。現(xiàn)場,劉聰還給超擬人數(shù)字人打了個“視頻電話”,他不斷調(diào)整道具“孫悟空”“奧特曼”“怪獸”的擺放位置,無需拍照,超擬人數(shù)字人看視頻說話,馬上回應(yīng):“奧特曼和孫悟空停止了打斗,正在聯(lián)合對抗怪獸 ”。
簡而言之,多模態(tài)的交互,從超擬人的語音迭代為超擬人的數(shù)字人,通過語音、視頻、圖文全部聯(lián)動交互,讓AI看見“世界”。
此背景下,訊飛星火開拓汽車等領(lǐng)域有了更大的想象力。
隨著多模態(tài)、數(shù)字人的融入,可以讓汽車的理解能力、交互能力更強(qiáng),同時具備超擬人、情感化的多模態(tài)表達(dá)能力,讓汽車交互更有溫度,讓汽車延伸成為高質(zhì)量的生活空間。
此外,訊飛啟動了國產(chǎn)超大規(guī)模智算平臺“飛星二號”。
訊飛星火是唯一基于全國產(chǎn)算力訓(xùn)練的完全自主知識產(chǎn)權(quán)大模型,不懼“卡脖子”的風(fēng)險(xiǎn),從“飛星一號”走向“飛星二號”,可以進(jìn)一步夯實(shí)國產(chǎn)化大模型的算力底座,讓大模型生長在更加自主可控的底座之上。
首發(fā)星火多語言大模型,助力車企高質(zhì)量出海
多模態(tài)之外,訊飛星火還升級了多語言能力。
行業(yè)首發(fā)了星火多語言大模型,支持英語、俄語、日語、阿語、韓語、法語、西語、葡語、德語共9種外語,涵蓋了全球主流語種。
其能力整體達(dá)到GPT-4o 96%的水平,在汽車、家電、辦公、翻譯等行業(yè)的任務(wù)場景應(yīng)用效果超過了GPT-4o。
“訊飛作為中國唯一的認(rèn)知智能全國重點(diǎn)實(shí)驗(yàn)室承建單位,我們有使命有責(zé)任要做多語言大模型”,科大訊飛董事長劉慶峰表示,訊飛星火底座能力要不斷提升,對標(biāo)全球最好水平,同時還要針對真實(shí)應(yīng)用場景做到全球最好,不斷擴(kuò)大多語種范圍,在多語種上為世界提供第二種選擇。

2023年中國汽車出海成為世界第一,多語種技術(shù)也在成為中國汽車出海的重要助力。艾媒咨詢的數(shù)據(jù)顯示,2023年中國汽車出海十強(qiáng)企業(yè),上汽集團(tuán)、奇瑞控股、長安汽車、長城汽車、吉利汽車、比亞迪、江淮汽車、東風(fēng)汽車、北汽集團(tuán)、中國重汽,有8家在與科大訊飛合作。
目前,訊飛智能車載語音系統(tǒng)已覆蓋23個主要語種,搭載車型已銷往亞洲、歐洲、中東、南美等地的60多個國家與地區(qū),讓海外用戶體驗(yàn)來自中國的智能用車服務(wù)。
由此可見,堅(jiān)持從技術(shù)中來,到產(chǎn)品中去,訊飛星火實(shí)現(xiàn)了技術(shù)創(chuàng)新與應(yīng)用落地的正循環(huán),正成為中國汽車出海的最佳拍檔。
奇瑞控股集團(tuán)董事長尹同躍曾在接受媒體采訪時表示:“高度智能化是現(xiàn)在中國汽車在全球最鮮明的形象標(biāo)簽,也是攻占中國乃至全球市場的核心‘利器’之一。”
事實(shí)上,科大訊飛一直是奇瑞出海最堅(jiān)實(shí)的伙伴。
過去二十一年,奇瑞汽車連續(xù)位居中國乘用車品牌出口第一名,背后離不開科大訊飛多語種的助力:聚焦奇瑞出海的重點(diǎn)區(qū)域,針對性研發(fā)英語、阿語、俄語、葡語等智能語音交互產(chǎn)品,成功助力奇瑞風(fēng)靡全球。
如今,雙方合作進(jìn)一步深化。
在新款奇瑞星紀(jì)元ET上,融合星火大模型最新能力,星火情景智能座艙能夠深度理解用戶的自由聊天、復(fù)合指令、知識類提問等需求,實(shí)現(xiàn)多語種多方言免切自由交互、多情感多模態(tài)超擬人交互以及多模態(tài)狀態(tài)感知等能力。
此次星火多語言大模型的發(fā)布,更好的交互體驗(yàn)、更優(yōu)的理解能力,或?qū)⑦M(jìn)一步推動中國汽車出海,也將推動大模型在汽車場景快速落地。
落地六大車企量產(chǎn)車,首發(fā)汽車端側(cè)星火大模型
為了在車端擁有更快捷、體驗(yàn)更優(yōu)的交互,訊飛星火行業(yè)首發(fā)了汽車端側(cè)星火大模型,或有望加速大模型在汽車行業(yè)落地。
相比云端大模型,端側(cè)1.3B大模型效果損失≤1%,端側(cè)首次響應(yīng)時間40ms,端云融合交互時間低至1.3s;基于汽車端側(cè)硬件,在無網(wǎng)環(huán)境下也能使用。
2024年第四季度起,汽車端側(cè)星火大模型,將率先在奇瑞、廣汽、長城的車型中陸續(xù)搭載上市開售。
眾所周知,大模型追求的是“端側(cè)響應(yīng)快、云側(cè)算力強(qiáng)”。
響應(yīng)快之外,隱私保護(hù)是另外一個端側(cè)的優(yōu)勢,如若沒有嚴(yán)格的隱私數(shù)據(jù)保護(hù),即使大模型能力再強(qiáng)悍,也毫無意義。
一名業(yè)內(nèi)人士告訴:“一個安全、可靠的大模型,必須打牢隱私地基,才有長遠(yuǎn)的發(fā)展空間,端云結(jié)合的確是最優(yōu)解。”
端云結(jié)合之外,訊飛星火也在聯(lián)合開發(fā)伙伴一起打造智能體生態(tài)。
智能體是最受青睞的AI應(yīng)用發(fā)展方向,制作門檻雖然不高,可要搶占汽車用戶的心智卻并非易事,必須解決真正的“痛點(diǎn)”。
以星火用車助手為例,其是基于訊飛星火的智能體,結(jié)合車輛運(yùn)行的行車場景與實(shí)時監(jiān)測數(shù)據(jù),可以給出專業(yè)的用車建議,堪比老司機(jī)。
譬如,遇到暴雨等低能見度路況,部分司機(jī)習(xí)慣打開雙閃行車,然而這并非正確操作,星火用車助手提示“建議打開前后霧燈,不要長時間開啟危險(xiǎn)警報(bào)燈行車”。
自研智能體之外,訊飛汽車智能體平臺已對接多家生態(tài)信源伙伴,涉及QQ音樂的音樂達(dá)人、愛奇藝的影視達(dá)人、支付寶的咖啡伙伴、高德地圖的AI向?qū)У龋粩嘭S富智能體的種類,繁榮了智能體生態(tài)。

以上可見,訊飛星火推動智能交互走向智能服務(wù),通過提供優(yōu)質(zhì)服務(wù)增加用戶黏性,從而不斷做大基本盤。
在今年1024開發(fā)者節(jié)的科博展上,訊飛星火落地的六大車企的量產(chǎn)車也來到現(xiàn)場,奇瑞星途星紀(jì)元ET、廣汽埃安V霸王龍、長城藍(lán)山、長安啟源A07、大眾與眾ID.UNXY、江淮RF8等的亮相,也讓用戶真切感受到訊飛星火在汽車行業(yè)的真切落地,率先開啟大模型落地汽車的步伐。





京公網(wǎng)安備 11011402013531號