DeepSeek推出DeepSeekMath-V2模型,主打自驗證數學推理能力
4B小模型數學推理首超Claude 4,700步RL訓練逼近235B性能
11/24 16:08
11/24 16:07
10/31 16:58
10/31 16:56