本钱直降 50 倍接 SFT纯蒸馏模型 呈现直,数据已悉数开源
最后更新 : 2025-07-04 03:42:13
a-m-team 又发新论文了 。纯蒸A呈
这个团队上星期刚刚在 Hugging Face 低沉开源了32B稠密模型 ,馏模但在多项要害推理评测中打败了 DeepSeek-R1 ,型S现直悉数并与超大规模的接S据已 MoE 模型Qwen3-235B-A22B 、Seed1.5-Thinking 平起平坐,本钱倍数因而赢得了海内外的直降不少重视。
今日,开源a-m-team 发布了一篇名为“Not All Correct Answers Are Equal: Why Your Distillation Source Matters”的纯蒸A呈论文