又一年1024,屬于開發者的節日,人工智能領域的“OG”科大訊飛一口氣發布了11項與訊飛星火大模型相關的領先技術、硬核產品與創新應用,展示了大模型究竟會怎樣改變人們的生活,也展示了一家“老牌”人工智能企業的使命與擔當。
語音視覺虛擬人交互“三合一” 讓聾啞人也能清晰說話
今年上半年,OpenAI在o1模型中展示出了實時交互技術,山姆·奧特曼將其比作科幻電影Her中的人工智能助手,但這一次,科大訊飛讓“Her”擁有了外觀與表情。
隨著與交互相關的AI應用不斷推陳出新,語音通話、視覺、虛擬人等交互技術“你方唱罷我登場”,不斷吸引著人們的眼球。本次發布會上,科大訊飛將上述技術“三合一”——超擬人數字人首次亮相,人機交互從單純的語音變成了超擬人數字人,語音、視覺、虛擬人的全部聯動的多模態交互。

圖/受訪者供圖
在科大訊飛研究院院長劉聰的現場演示中,超擬人數字人可以隨時對用戶的問題予以反饋,不僅能夠達到實時交互的效果,例如根據玩具擺放的不同姿勢實時解說“孫悟空”“奧特曼”“怪獸”的劇情,還能同時做出表情,就像和真實存在的朋友進行視頻通話。
值得注意的是,目前訊飛星火支持用戶創建自己的個性化數字人,打造每個人的數字分身。可以預見,結合數字人的實時通話能力,這必將進一步擴展大模型的應用場景,讓Her更快走進現實,讓每個人都擁有可以隨意定制、隨時和自己“視頻通話”的能看見的AI伙伴。
此外,今年科大訊飛的演示還更加具有人文關懷。作為AI語音領域的領頭羊,今年6月27日,科大訊飛在發布會上“秀”了一把嘈雜環境下三人同時說話語音轉文字的驚艷效果;今年9月,科大訊飛在國際最權威、最難的高噪場景的語音識別大賽CHiME上再次獲得冠軍。而這一最先進的技術,科大訊飛也用到了助殘領域。
“大家好,我是舞蹈演員魏菁陽。”當聽到這句口齒清晰的語音時,現場爆發出了熱烈的掌聲。這句話的聲音屬于中國殘疾人藝術團舞蹈演員魏菁陽,她在幾年前推出的舞蹈作品我的夢引起了巨大震撼,作為一名聾啞人,她說話不夠流暢,發音模糊,但通過科大訊飛與華為聯合研發的聲音修復技術,她能夠通過AI“修復”自己的原音,并發出清晰的聲音。
“今天的AI技術不僅賦能工業、科研這些重要場景,也可以幫助到每一個特別的你——無論老人、孩子,還是特殊群體。”在現場,科大訊飛董事長劉慶峰動情地說。
展示AI應用“六邊形戰士” 根據地業務技術含量再升級
實際上,上述發布的內容僅是本次科大訊飛1024開發者節的“冰山一角”。具體來看,本次大會發布的硬核產品與創新應用共有11項,分別為:定義多模AIUI標準;發布超擬人數字人;發布星火多語言大模型、訊飛星火醫學影像大模型、汽車端側星火大模型;發布首個基于“問題鏈”的高中數學智能教師系統、星火智慧黑板2.0、AI作業過濾器等;發布星火智辦一體機、智能座艙人機交互效果評測機器人VIAS以及科大訊飛多語種 AI 翻譯透明屏,以及訊飛星火大模型的最新升級版本訊飛星火4.0 Turbo。
這11項發布展示了科大訊飛在大模型應用領域的深度與廣度,其覆蓋了從與國家發展相關的工業、科研、央國企服務,到緊系民生的教育、醫療、政務等各種場景,充分說明了為什么業界人士稱2024年是AI的“商業化落地元年”。
但從一些技術的進步上,我們可以發現,科大訊飛也正在逐漸增加AI落地具體場景的深度,從其選擇切入的場景上,我們能夠看出這家公司對技術能力的深入思考。
例如在科大訊飛深耕多年的“根據地業務”之一的醫療板塊上,該公司一直希望能夠用人工智能打造每個醫生的診療助理,其“智醫助理”人工智能輔助診療功能已經上線多年,累計提供8.6億次的輔助診斷,提醒不合理處方8100多萬個。
而這一次,劉慶峰強調,要從更有溫度的人文關懷出發,持續學習頂尖醫生的能力。科大訊飛找到的切入點是影像數據。

圖/受訪者供圖
據了解,中國的影像科醫生總數相對不足,每年有40%影像數據的增長,但是影像科醫生只增長4%;拍片的質量參差不齊,信息不完整率接近40%。對此,科大訊飛在安徽用人工智能率先實現了中國目前為止應用規模最大的影像云平臺。安徽省衛生健康委、醫保局推動全省所有的公立醫院全部聯網,使得在全省任何醫院的一次檢查全省通用,不用再重復檢查。一次檢查一輩子保存,可以隨時查看變化情況。而在這背后,是科大訊飛用人工智能判斷檢查質量、拍片質量是否達標的技術能力。
這也是一次技術和民生的“雙贏”,因為是訊飛星火醫療大模型的能力結合安徽省醫學影像云平臺的海量數據,在此基礎上,訊飛星火醫學影像大模型才能正式發布。
為世界提供“第二種選擇” 中國AI公司的擔當
更值得一提的是,在2024諾貝爾獎物理獎和化學獎都頒給了AI相關領域科學家的當下,科大訊飛也強調了AI賦能科研是公司的重要使命。
諾貝爾化學獎獲得者,DeepMind創始人哈薩比斯曾在獲獎后表示,“我不認為在公司做研究和在學院做研究有什么不同,無論在哪,只要方法得當,都能做出偉大的科學成就,許多新興科學、新領域和新的研究發現需要大量資源,為什么不利用私營部門的資金來支持這些研究呢?只要堅持科學方法,并以真正科學嚴謹的態度來對待,追求重大問題即可。”
在本次發布中,劉慶峰展示了科大訊飛是如何“身體力行”賦能科研的:星火科研助手2.0已在中國科學院下屬116個院使用,使得科研成果的調研效率提高10倍以上,論文研讀效率的有效率超過90%,“這次,我們又進一步升級了論文預審和推薦能力。訊飛星火的代碼能力已在全國332所院校開通使用,學生主動提問增加了一倍,教師輔導工作量減少了80%。”
事實上,與雙一流985中國科學技術大學同處合肥,吸收廣大科研人才的同時,科大訊飛本身對科研也極端重視,在人工智能助力科研攻關方面,科大訊飛不遺余力,如中科大生命學院劉海燕教授團隊基于條件擴散生成模型的蛋白質主鏈設計,把原來需要6個月的實驗提速到只需1天完成,已成功設計了48個自然界不存在的全新蛋白質。李建剛院士使用大模型助力合肥人造小太陽——基于Transformer強化學習的托卡馬克等離子體控制,把原來模擬器預測誤差從7%降到3%,模擬器預測時間從10天降到1小時,具有里程碑意義。
對科研的重視從科大訊飛的財報中也可見一斑。今年上半年,科大訊飛研發投入21.9億元,同比增長32.23%,占營收比重達23.5%。其中,大模型研發及產業落地拓展等方面,新增投入超過6.5億元。
相比其他同業公司,科大訊飛在本次發布會中也展示了中國AI公司所必須的擔當。如本次首次發布星火多語言大模型,除中英文外,可支持俄、日、阿、法等8個語種,為什么中國大模型要做多語種?劉慶峰表示,“如果中國的大模型廠商都只做中文,全球沒有第二種選擇,我們就必然會被鎖在中國范圍之內。”
科大訊飛立志要做自主可控的全國產大模型。科大訊飛聯合華為建設了首個國產萬卡算力集群“飛星一號”平臺,并于去年10月24日上線。劉慶峰表示,最近一年攻克了很多大模型集群訓練的“疑難雜癥”,解決了500多次基礎軟硬件問題,模型訓練適配優化平臺耗時從90天縮減到15天,新增30多項框架和平臺特性,優化了150多個基礎、通信和融合算子。
這次發布會上,科大訊飛、華為、合肥市大數據資產運營有限公司三方聯合打造的國產超大規模智算平臺“飛星二號”正式啟動。

圖/受訪者供圖
“今天是一個全面共創的時代,不僅僅是科大訊飛的平臺及基礎底座能力的廠商、科研院所、開發者、教師醫生等專業團隊,每一個用戶的每一次提問都是大模型進步非常重要的基石,聚沙成塔最重要的來源。你們對AI的愿望,就是我們未來努力的方向,期待著我們攜手努力,解放生產力,釋放想象力,在中國用人工智能建設美好世界,并且給世界提供第二種選擇。”劉慶峰說。
文/羅亦丹
編輯 王真真
校對 劉軍





京公網安備 11011402013531號