IT之家 8 月 4 日消息,據科大訊飛官方公眾號,香港特區立法會與科大訊飛聯合打造了智慧謄錄系統“智識聽”,可深度識別立法會場景的實時字幕功能,運用科大訊飛中英粵混讀引擎,結合聲紋識別和字幕與幀畫面對齊壓制技術,實現會議直播中文字和視頻畫面的同軌顯示,公眾可通過實時字幕無障礙獲取政策資訊。
“智識聽”深度學習 2.5 億字語料、400 小時音頻、20 萬條香港特色關鍵詞,口音、新地名、混語發言實時適配,即使面對議員特殊口音或復雜地名也能高效處理。目前,實時字幕的準確率達 96%,通過幕后同事的即時修正,準確率通過人機結合可達 99%。
![]()
IT之家從官方獲悉,“智識聽”正式調研、研發、上線歷時近 3 年,1.0 版具備錄音轉文字功能,2.0 引入對實時轉文字的支持,3.0 版則開始支持實時字幕。為解決粵語俚語及法律專業術語較多、部分議員存在口音、中英粵混雜等問題,立法會秘書處整理了 2.5 億漢字的中英文對照和 20 萬個高頻粵語詞匯,將其作為語料庫提供給機器學習。經過數據和算法的優化和不斷地訓練,立法會會議實時字幕的準確率達 96%。
原先,需要 7 個工作日才能發布的議事錄,會議召開后第二天即可發布。目前智識聽四期正在準備中,該期將建設英語字幕和多語種字幕系統。同時,基于星火大模型的進步,香港立法會的智慧辦公系統也提上日程。
![]()





京公網安備 11011402013531號