IT之家 11 月 25 日消息,阿里巴巴集團旗下的阿里云于 11 月 24 日宣布,將為新加坡國家人工智能計劃(AI Singapore,簡稱 AISG)最新版本的“Sea-Lion”大語言模型(LLM)—— 即 Qwen-Sea-Lion-v4 提供技術支持。值得一提的是,AISG 此次是放棄了 meta 模型,轉向阿里巴巴的通義千問 Qwen 開源架構。

阿里云在新聞稿中指出,該最新版本基于阿里云的 Qwen3-32B 基礎模型構建,其發布標志著 AISG 在推動區域范圍內更強大、更普惠的人工智能解決方案方面邁出了“重要一步”。
此外,雙方合作還包括阿里云為該大模型的“高級后訓練階段”提供技術支撐。阿里云強調,基礎模型 Qwen3-32B 已額外接受了超過 1000 億個東南亞語種詞元(tokens)的訓練,從而顯著提升了其對本地表達方式、對話細微差別及區域性知識領域的理解能力。
作為 Qwen 系列的最新一代,Qwen3 基礎模型本身已在規模龐大、高度多元的數據集上完成預訓練,涵蓋 119 種語言與方言,總訓練數據量達 36 萬億詞元。這使其從初始階段即具備更廣泛的語種覆蓋能力,尤其強化了對主流人工智能模型中通常代表性不足的東南亞語言的支持。
作為合作的另一關鍵環節,AI Singapore 貢獻了其開源的區域性數據集 —— 包括面向東南亞語言任務的數據整理、優化與評估工作。
目前,Qwen-Sea-Lion-v4 在參數規模低于 2000 億的開源大模型中,位居“東南亞語言模型綜合評估排行榜”(South-east Asian Holistic evaluation of Language Models)首位。該模型已在 AI Singapore 官網及 Hugging Face 平臺開放免費下載。
值得一提的是,2023 年 12 月,新加坡正式啟動一項總額 7000 萬新元(IT之家注:現匯率約合 3.81 億元人民幣)的國家級計劃,旨在全面提升本國在多模態大語言模型領域的科研與工程能力。該項目由新加坡國家研究基金會(NRF)提供資金支持,并獲資訊通信媒體發展局(IMDA)背書。





京公網安備 11011402013531號