9月12日,據(jù)小米技術(shù)消息,近日,小米集團(tuán)AI實(shí)驗(yàn)室新一代Kaldi團(tuán)隊(duì)發(fā)布了基于Flow Matching架構(gòu)的ZipVoice系列語音合成(TTS)模型——ZipVoice(零樣本單說話人語音合成模型)與ZipVoice-Dialog(零樣本對(duì)話語音合成模型)。
官方表示,ZipVoice解決了現(xiàn)有零樣本語音合成模型的參數(shù)量大、合成速度慢的痛點(diǎn),ZipVoice-Dialog則解決了現(xiàn)有對(duì)話語音合成模型在穩(wěn)定性和推理速度上的瓶頸。





京公網(wǎng)安備 11011402013531號(hào)