小米开源“Xiaomi MiMo”大模型,股价上涨近5%
kiki 2025-04-30 20:57:16 浏览:130
30日上午,小米大模型团队宣布开源旗下首个推理大模型「Xiaomi MiMo」。
该模型以7B轻量级参数量实现突破性性能,在数学推理(AIME 24-25)和代码生成(LiveCodeBench v5)测评中超越OpenAI闭源模型o1-mini及阿里32B级开源模型QwQ-32B-Preview。
其核心能力源于预训练与后训练联动技术:预训练阶段通过挖掘高密度推理数据并合成200B tokens专项语料,结合“基础→复杂→综合”三阶段渐进训练(总训练量25T tokens),强化逻辑抽象能力;后训练阶段创新提出动态奖励机制(Test Difficulty Driven Reward),根据问题难度动态调节奖励权重,配合简单数据重采样策略平衡训练样本,同时通过自研无缝展开系统(Seamless Rollout)实现强化学习训练效率提升2.29倍。
模型开源生态覆盖基础版、数学增强版、代码优化版和强化学习精调版四大衍生版本,完整公开技术细节与工具链,并支持消费级GPU部署,推理速度较同规模模型提升17%,为轻量化专业推理模型提供了高性价比解决方案。