小米首个推理大模型(Xiaomi MiMo),前DeepSeek研究员罗福莉加入
Xiaomi MiMo是小米公司于2025年4月30日开源的首个推理大模型,由该公司大模型Core团队研发,通过预训练与后训练联动机制提升推理能力。该模型参数规模为7B,在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)测评中,性能超过OpenAI的闭源推理模型o1-mini及阿里Qwen的开源推理模型QwQ-32B-Preview 。
该模型采用三阶段预训练流程,累计训练25T tokens数据,其中合成约200B tokens推理专用数据。
后训练阶段引入Test Difficulty Driven Reward算法和Easy Data Re-Sampling策略,并通过Seamless Rollout系统实现强化学习训练加速2.29倍、验证加速1.96倍 。
2025年前DeepSeek研究员罗福莉参与MiMo模型的核心研发工作。
发展历程
2025年4月30日,小米首个推理大模型MiMo开源。
2025年10月,小米AI团队与北京大学联合发布聚焦MoE与强化学习的论文,罗福莉以小米研究员身份署名。
2025年11月12日,前DeepSeek研究员罗福莉正式宣布加入小米,担任AI大模型团队负责人,团队将致力于通过Xiaomi MiMo推动AGI向物理世界延伸。
相关链接
企业AI知识库搭建与运营培训课程
呼叫中心AI知识库培训课程
个人知识体系构建能力课程
知识库知识管理系统
企业AI知识管理知识库软件系统清单
个人知识管理软件AI知识库系统清单
罗福莉
女,95后,出生于四川省,本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学研究所计算语言学专业 。
罗福莉2019年曾在国际顶级会议ACL上发表8篇论文,其中2篇为第一作者。罗福莉的职业生涯始于阿里巴巴达摩院,罗福莉主导开发了多语言预训练模型VECO,并推动了AliceMind的开源工作。2022年,罗福莉转战DeepSeek,参与了MoE大模型DeepSeek-V2的研发。
2024年12月,网传罗福莉被小米创始人雷军以千万年薪招募,担任小米AI实验室的大模型团队负责人。12月31日,罗福莉的高中班主任告诉红星新闻记者,罗福莉还没决定去小米,还在考虑。2025年2月,记者从罗福莉亲属处获悉,罗福莉已到新岗位上班。 2月18日,罗福莉在朋友圈发文呼吁:“请互联网还我一片安安静静做事的氛围吧!几年前就说过我并非天才少女,神化一个人的结果就是捧得多高摔得多重! ”
2025年11月12日,罗福莉正式宣布,已经加入小米。