阿里AI四連發,橫掃全球開源榜單第一名
Step 3采用MoE架構,總參數量321B,激活參數量38B
隨著趙的加入,Meta 現在擁有兩位首席人工智能科學家
阿里千問3推理模型更新,比肩Gemini-2.5 pro、o4-mini
HumanOmniV2通過引入強制上下文總結機制、大模型驅動的多維度獎勵體系,以及基于GRPO的優化訓練方法,實現了對多模態信息的全面理解,使得模型不會錯過圖像、視頻、音頻中的隱藏信息,一定程度上規避其在全…
M1支持目前業內最高的100萬上下文的輸入,是DeepSeek R1的8倍。
MiniMax深夜開源!首個推理模型,4560億參數、百萬上下文、價格低至0.8元
炸裂!Claude以第一作者寫論文反駁蘋果“推理模型根本沒有推理能力”:蘋果有三大錯誤
歐洲有了自己的推理模型,即 Mistral 的 Magistral,分為兩個版本:中型和24B,不過這個模型性能遠遠不及DeepSeekR1-0528,他們用的對比模型還是DeepSeek R1,Magis…
在幾周前,Mistral 還發布了多個專注于編程的模型,并推出了 Le ChatEnterprise,這是一款面向企業的聊天服務,提供人工智能代理構建器等工具,并將 Mistral 的模型與 Gmail 和…
6月10日,法國科技公司Mistral AI表示,該公司推出首個AI推理模型Magistral,將以開放版和企業版兩種形式發布。Mistral AI稱,該模型通過邏輯推理生成響應,同時融合跨專業領域的專業知識…
6 月 11 日消息,OpenAI 正以迅猛的節奏不斷更新新一代生成式 AI 模型。繼 4 月在 ChatGPT 平臺上線 o3 和o4-mini 后,OpenAI 的最強模型 o3-pro 已于…
微軟支持的法國人工智能公司Mistral AI首席執行官Arthur Mensch表示,公司將推出其首個推理模型Magistral。Mensch表示,該模型在數學和編程方面表現出色,其與競爭對手的不同之處在于…
6月9日消息,阿里巴巴在4月29日開源新一代通義千問模型Qwen3(簡稱千問3),參數量僅為DeepSeek-R1的1/3,成本大幅下降,性能則在各項測評中創下國產模型新高。 數據顯示,阿里通義千問3大…
蘋果近期發布了一篇研究論文,指出當前主流的推理模型其實并不具備真正的思考能力。 此外,雖然論文揭示了當前模型在推理能力上的局限性,但也有人認為其意圖并非單純否定現有成果,而是希望引起業界對更有效推理機制與評…
5 月 14 日消息,非營利 AI 研究機構 Epoch AI 最新發布報告,指出 AI企業難以從推理模型中,持續榨取巨大性能收益,最快在一年內,推理模型的進步將放緩。 而這些推理模型通過增加計算…
Phi-4-reasoning 是一款擁有 140 億參數的開源推理模型,通過監督微調(SupervisedFine-Tuning,SFT)Phi-4,結合 OpenAI o3-mini 的高質量推理演示…
而這些推理模型通過增加計算資源來解決問題,從而提升性能,不過作為代價,這些推理模型需要更多計算來處理復雜任務,因此比傳統模型耗時更長。 IT之家注:推理模型的訓練過程先是基于海量數據訓練一個常規模型,然后應…
科大訊飛2025年第一季度經營活動產生的現金流量凈額較上年同期增長48.54%,公司經營基本面保持健康發展態勢。 截至2025年3月31日,中移動持有訊飛10.03%股權,劉慶峰持股為5.55%,中科大資產…
今年2月份,由部分OpenAI前員工創辦的Anthropic在全球范圍內率先發布了名為Claude 3.7Sonnet的混合推理模型,被視為融合了DeepSeek V3(適于通用任務)與R1(適于推理任務…
4 月 3 日消息,科技媒體 Windows Latest 昨日(4 月 2 日)發布博文,報道稱 Windows10、Windows 11 新版 Copilot 應用已摘掉 Beta 帽子,已向…
理想汽車基于海量車載場景數據,以及通用推理模型深度思考訓練數據,量身打造了自主決策推理模型,在保證模型效果的同時還大幅提升響應速度。基于大量用戶需求,理想汽車優化了跨屏點播功能,優化了視頻應用的語音交互體驗。…
10/31 16:58
10/31 16:56
10/31 16:55