當(dāng)前位置：首頁 ? 資訊 ? 新零售 ? 正文

Nari Labs 開源 16 億參數(shù)文字轉(zhuǎn)語音模型 Dia，支持精細化調(diào)節(jié)

IP屬地中國·北京 編輯：江紫萱 IT之家 時間：2025-05-16 18:17:20

4 月 24 日消息，由兩名韓國研究者組建的 Nari Labs 工作室于前天在 GitHub 和 Hugging Face 開源了擁有 16 億參數(shù)的文字轉(zhuǎn)語音 AI 模型 Dia，目前相應(yīng)模型已在 GitHub 上收獲了超過 9300 顆星標(biāo)，附項目 GitHub 頁如下：https://github.com/nari-labs/dia
相應(yīng)研究者聲稱 Dia 的音質(zhì)相對于業(yè)界的文字轉(zhuǎn)語音模型擁有更靈活的自由度，同時在生成的語音自然度方面超越了 ElevenLabs Studio、Sesame 等競品。其支持對輸出音頻的音色、情緒和語調(diào)進行精細調(diào)節(jié)，還能模擬各種非語言交流（如大笑、咳嗽或清嗓子等）。
官方對比測試顯示，Dia 在聲調(diào)自然度、表情豐富度和語音節(jié)奏感方面，均優(yōu)于專注自然語音合成的 ElevenLabs Studio 以及 Sesame 推出的對話語音模型 CSM-1B。
目前，Dia 僅支持英文，需要英偉達 RTX 3080 及以上顯卡才能本地部署運行，不過用戶也可以在 Hugging Face Spaces 線上平臺中在線使用。Nari Labs 表示，后續(xù)將推出面向普通消費者的一鍵部署服務(wù)，進一步降低使用門檻，讓更多人無縫體驗高質(zhì)量文本轉(zhuǎn)語音技術(shù)。

免責(zé)聲明：本網(wǎng)信息來自于互聯(lián)網(wǎng)，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點。其內(nèi)容真實性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系我們，本站將會在24小時內(nèi)處理完畢。

同類資訊

放棄吧！“高速全面取消收費”根本沒戲，免費只會更痛苦

八部門：進一步加大力度促進汽車消費促進汽車梯次消費、更新消費

新車難用滿十年：技術(shù)短板、消費文化與行業(yè)策略如何共同“縮短”壽命

山東青島：“微醺巴士”開拓文旅消費新場景

牛市就到這了？

拉布布暑期降溫，中國潮玩出海彎道超車，誰是下一個頂流IP

全站最新

項立剛：要把羅永浩做成創(chuàng)業(yè)課程「失敗案例」

小米汽車再上熱搜，人已去世！

清華孫茂松：工業(yè)界大廠可以Scaling，其他玩家重在垂直應(yīng)用

“聰明錢”今年在幣圈也被“割韭菜”了

熱門推薦

放棄吧！“高速全面取消收費”根本沒戲，免費只會更痛苦

八部門：進一步加大力度促進汽車消費促進汽車梯次消費、更新消費

新車難用滿十年：技術(shù)短板、消費文化與行業(yè)策略如何共同“縮短”壽命

山東青島：“微醺巴士”開拓文旅消費新場景

牛市就到這了？

拉布布暑期降溫，中國潮玩出海彎道超車，誰是下一個頂流IP

南城香創(chuàng)始人汪國玉：平臺消費券激發(fā)消費熱情，門店收入利潤均提升

通信企業(yè)：“推銷熱售后冷”消磨用戶信任

盛銀消金 25% 股權(quán)再被凍結(jié)！新董事長年初剛上任

伊利出席第八屆中澳工商界首席執(zhí)行官圓桌會助力中澳經(jīng)貿(mào)合作提速升級

商查平臺企業(yè)信息查詢新范式：水滴信用企業(yè)查詢MCP

從“閃購”到“觀望”：Prime Day被拉長的背后，是消費者與平臺的“雙重博弈”

澎湃漫評｜通信企業(yè)為何“推銷熱售后冷”

“電商西進”助力豫企破浪：一枚魚油的3000公里“暖心”之旅

京東外賣取消超時免單，改為“準(zhǔn)時寶”服務(wù)