12月5日,火山引擎正式發布豆包語音識別模型2.0(Doubao-Seed-ASR-2.0),依托Seed混合專家大語言模型架構構建。
據官方介紹,2.0版本模型推理能力提升,可以通過深度理解上下文完成精準識別,上下文整體關鍵詞召回率提升20%。支持多模態視覺識別,在聽得懂的同時看得懂,可以通過單圖和多圖等視覺信息輸入提升文字識別精準度。
支持日語、韓語、德語、法語等13種海外語種的識別。并且重點針對專有名詞、人名、地名、品牌名稱及易混淆多音字等復雜場景進行了升級。

12月5日,火山引擎正式發布豆包語音識別模型2.0(Doubao-Seed-ASR-2.0),依托Seed混合專家大語言模型架構構建。
據官方介紹,2.0版本模型推理能力提升,可以通過深度理解上下文完成精準識別,上下文整體關鍵詞召回率提升20%。支持多模態視覺識別,在聽得懂的同時看得懂,可以通過單圖和多圖等視覺信息輸入提升文字識別精準度。
支持日語、韓語、德語、法語等13種海外語種的識別。并且重點針對專有名詞、人名、地名、品牌名稱及易混淆多音字等復雜場景進行了升級。

標簽: 模型 豆包 語音 視覺 名稱 精準 整體 語種 韓語 德語 日語 多音字 模態 重點 專有名詞 地名 文字 品牌 架構 版本 法語 精準度 語言 專家 深度 關鍵詞 引擎 信息 場景 官方 科技 鳳凰
免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。
熱門推薦