12月15日,阿里通義宣布開源Fun-CosyVoice3-0.5B,該版本提供了zero-shot(注:零樣本)音色克隆能力,只需要你提供一段3秒以上的參考音頻,即可復(fù)刻其音色并合成新語音,并且支持本地部署和二次開發(fā)。
此外,通義推出輕量化版本Fun-ASR-Nano模型,總參數(shù)量壓縮到0.8B,推理成本更低,現(xiàn)已開源,支持本地部署與定制化微調(diào)。
值得一提的是,通義還增強(qiáng)了Fun-ASR模型,噪聲場景準(zhǔn)確率93%、支持歌詞與說唱識別。






京公網(wǎng)安備 11011402013531號