DeepSeek V3.2正式版發布:推理比肩GPT-5
DeepSeek推出DeepSeekMath-V2模型,主打自驗證數學推理能力
創始人是ICML'25時間檢驗獎作者。
援引博文介紹,英偉達針對這一難題,推出了 OpenMath-Nemotron-32B 和OpenMath-Nemotron-14B-Kaggle兩款模型,基于 Qwen 系列 transforme…
研究人員要求模型輸出自然語言描述和 Python 代碼形式的“思維鏈”步驟,并將自然語言作為 Python 代碼注釋,僅使用 Python代碼輸出訓練模型。 研究人員使用了 74 萬道公開的數學應用題及其…
此前,MM Grupp 是 ZA/UM 開發的 RPG 游戲《極樂迪斯科》的主要投資者之一。 Dark Math 是今年初由前 ZA/UM員工創立的工作室,創始人包括《極樂迪斯科》的執行制作人 Kaur K…
QwQ-32B-Preview 包含 325 億個參數,能夠處理最長 32000 個 tokens 的提示詞;在 AIME 和 MATH基準測試中,它的表現優于 OpenAI 的兩個推理模型 o1-pre…
11 月 26 日消息,月之暗面于 11 月 16 日發布了新一代數學推理模型 k0-math,官方今日宣布基于該模型的 Kimi數學版上線。 在 Kimi 網頁版中,選擇側邊欄的“眼鏡”圖標,即…
11 月 15 日消息,研究機構 Epoch AI 現公布了一款名為 FrontierMath 的全新 AI模型數學基準測試集,旨在評估系列模型的數學推理能力。 與現有諸如 GSM-8K、MATH…
專題論壇上,上海紐約大學數學和數據科學助理教授Mathieu Laurière分享了用于大規模多代理系統的機器學習和生成式AI。Mathieu Laurière指出,通過多智能體系統可以了解人們的行為及決…
9 月 16 日消息,MathWorks 于 9 月 12 日發布了 MATLAB 和 Simulink 產品系列版本 2024b(R2024b)。 除了 MathWorks 平臺產品的改進之外,…
11/24 16:08
11/24 16:07
10/31 16:58
10/31 16:56