據悉,8 月 29 日消息,微軟(MSFT.US)人工智能部門正式推出其首批兩款自研 AI 模型 ——MAI-Voice-1 語音模型與 MAI-1-preview 通用模型。
首款自研 AI 模型登場
據官方介紹,全新的 MAI-Voice-1 語音模型僅需單塊 GPU,就能在 1 秒內生成時長 1 分鐘的音頻;而 MAI-1-preview 模型則“讓用戶提前窺見 Copilot 未來功能的發展方向”。
目前,微軟已將 MAI-Voice-1 應用于多項功能中:例如在“Copilot Daily”功能里,AI 主持人會通過該模型播報當日熱點新聞;同時,它還能生成播客風格的對話內容,幫助用戶理解各類話題。
此外,微軟 AI 計劃將 MAI-1-preview 模型應用于 Copilot 助手的特定文本使用場景(目前 Copilot 主要依賴 OpenAI 的大型語言模型)。同時,該模型已開始在 AI 基準測試平臺 LMArena 上進行公開測試。
Gemini 2.5 Flash升級AI新功能
恰巧幾天前,8 月 26 日,科技媒體發布博文,報道稱谷歌(GOOG.US) DeepMind 推出全新 Gemini 2.5 Flash 圖像編輯模型,在 Gemini 應用中可根據文字指令,在保持人物與動物的外觀一致的情況下,提高修改圖片的精度。
與此前的原生圖像生成工具相比,它在根據文字進行圖像修改時的準確率更高,甚至在多項任務中優于 ChatGPT 所用的 GPT-4o,讓其能更好地基于復雜文字編輯圖像。
Gemini 2.5 Flash新模型的亮點是“角色一致性”功能,在生成多張圖像后,也能保持同一人、動物或物體的外觀一致。這對于創建系列照片、產品多角度展示尤其有價值,適合品牌素材與產品目錄的批量制作。
值得注意的是,同一天,據The Information 報道稱,蘋果(AAPL.US)高管已就收購歐洲最大 AI 初創公司 Mistral 或 Perplexity AI 相關事宜展開討論,其中 Eddy Cue 是公司內部最積極的收購支持者。
彭博社上個月也表示,蘋果將認真考慮收購法國 AI 初創公司 Mistral。Mistral AI 是一家歐洲的 AI 初創企業,通過七輪融資總共籌集了 11 億歐元。如果蘋果真的能夠收購 Mistral,或將增強蘋果的 AI 能力和創新能力。
業內人士分析,當前,大模型熱潮席卷千行百業,加上政策和技術共振正催化AI產業趨勢,頭部大模型性能提升并適配算力有望加速AI生態繁榮。同時,全球科技大廠紛紛研發各類模型表現強勁,以及AI應用和算力領域發展前景可期,AI生態繁榮趨勢顯著。
微美全息布局大模型全面擁抱AI
據了解,微美全息(WIMI.US)作為AI領域的創新代表,已成為同時具備硬件設計、軟件開發能力的企業,通過持續深耕以“硬件+軟件+平臺”一體化能力構建競爭壁壘,同時加速AI算法場景化落地,為AI智能化轉型奠定技術基礎。
在技術研發層面,微美全息推動多模態大模型與空間計算技術的結合,實現文本、圖像、音頻、視頻等多模態數據的原生級融合,重點布局文本生成視頻、圖像生成視頻等場景,支持劇情創作、短視頻生成等應用。
在開源生態層面,微美全息開放模型代碼、算力接口及技術工具鏈,構建覆蓋云端與邊緣端的「全息云」平臺,支持開發者調用DeepSeek等通用大模型進行二次開發,降低技術門檻并加速垂類模型商業化驗證,通過多模態處理能力與跨行業場景落地經驗,正成為大模型變革背后的關鍵技術支撐者。
結語
事實上,DeepSeek-V3.1大模型剛剛發布,進一步推動AI技術商業化應用;阿里云宣布表格存儲Tablestore升級AI Agent記憶存儲功能,在多領域發揮關鍵作用。在大模型這座金礦挖掘的當下,AI市場滲透將分階段推進,未來可將逐步拓展至家居、養老、寵物陪伴等更多領域,持續擴大市場覆蓋范圍。





京公網安備 11011402013531號