news 2026/2/26 5:28:17

媲美 DeepSeek-V3.2,小米开源3090亿参数大模型,把手机的性价比卷到 AI

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
媲美 DeepSeek-V3.2,小米开源3090亿参数大模型,把手机的性价比卷到 AI

2025年12月17日,在小米“人车家全生态”合作伙伴大会上,新近加入小米的Xiaomi MiMo大模型负责人罗福莉首次公开亮相,发布了小米自研的推理大模型MiMo-V2-Flash,并宣布其全面开源

该模型采用混合专家架构,总参数为309B,激活参数为15B,实现极致的推理效率。

01 技术背景

小米此次发布的MiMo-V2-Flash是该公司自主研发的首个推理大模型。

模型负责人罗福莉于今年11月加入小米,此前她曾主导开发多语言预训练模型VECO,并参与了MoE大模型DeepSeek-V2的研发。

罗福莉在本次大会上表示,智能终将从语言迈向物理世界,她正在小米与团队共同构建这样的未来。

02 核心参数与性能

MiMo-V2-Flash采用混合专家架构,总参数量为309B,实际激活参数量为15B。

罗福莉指出,与同类模型相比,MiMo-V2-Flash的参数量减少了1/2至2/3,但在多项评测中性能表现突出。

该模型在多项权威代码与智能体评测基准中已位居全球开源模型前列。具体来看,其在SWE-Bench Verified测试中获得73.4%的分数,超越了DeepSeek-V3.2和Kimi-K2-Thinking等主流开源模型。

03 技术创新

MiMo-V2-Flash在技术架构上采用了一系列创新设计。该模型采用了混合注意力架构,具体为5层滑动窗口注意力与1层全局注意力交替使用。

滑动窗口注意力机制将每个token的注意力视野限制在邻近的128个token内,这种设计可以将注意力计算复杂度从平方级降低为线性级

研究团队发现,128被证明是窗口大小的最佳数值,而512反而会导致性能下降。为缓解滑动窗口可能导致的长文理解问题,模型引入了可学习的注意力汇聚偏置。

04 训练与效率优化

在模型训练方面,MiMo-V2-Flash采用了多教师在线策略蒸馏的新范式。这种方法只需要传统训练方法约1/50的算力,就能使学生模型达到教师模型的性能峰值。

模型支持深度思考与联网搜索功能,能够实现自然流畅的人机对话,并在需要实时数据获取、动态信息查询或资料验证的场景中提供支持。

模型原生支持32K序列长度,可扩展至256K上下文窗口。

05 成本与可用性

MiMo-V2-Flash展现出卓越的推理速度与成本控制能力。API定价为每百万token输入0.1美元、输出0.3美元。

罗福莉指出,对比闭源竞品Claude 4.5 Sonnet,该模型的推理成本仅为其2.5%左右。模型已经在Hugging Face上以MIT许可协议发布,包括基础版权重。

小米还推出了在线AI聊天服务Xiaomi MiMO Studio,可以通过该平台体验MiMo-V2-Flash。该服务支持深度思考和联网搜索功能。

小米模型体验地址:

https://aistudio.xiaomimimo.com/

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/26 20:01:37

【dz-996】物联网的家居环境预警监测系统

摘要 随着城市化进程的加快和居民安全意识的提升,家居环境的安全监测与智能预警对保障家庭生命财产安全具有重要意义。传统的家居安全管理多依赖人工检查和独立报警设备,存在监测不全面、响应滞后、联动性差等问题,难以满足现代化家居的安全…

作者头像 李华
网站建设 2026/2/26 14:56:53

【dz-998】导盲犬多功能喂食器的设计与实现

摘要 导盲犬作为视障人士的重要辅助伙伴,其健康状况与饮食管理密切相关。传统的喂食方式依赖人工操作,存在喂食时间不规律、食物和水量把控不准、环境不适影响健康等问题,难以满足导盲犬科学养护的需求。​ 基于 STM32F103C8T6 单片机的导盲…

作者头像 李华
网站建设 2026/2/26 10:37:36

终极Windows动态桌面指南:打造个性化视频壁纸的完整教程

终极Windows动态桌面指南:打造个性化视频壁纸的完整教程 【免费下载链接】DreamScene2 一个小而快并且功能强大的 Windows 动态桌面软件 项目地址: https://gitcode.com/gh_mirrors/dr/DreamScene2 厌倦了单调的静态桌面背景?想要让你的电脑桌面真…

作者头像 李华
网站建设 2026/2/26 15:06:46

Mem Reduct系统优化评测:告别卡顿的智能性能管家

Mem Reduct系统优化评测:告别卡顿的智能性能管家 【免费下载链接】memreduct Lightweight real-time memory management application to monitor and clean system memory on your computer. 项目地址: https://gitcode.com/gh_mirrors/me/memreduct 还在为电…

作者头像 李华
网站建设 2026/2/26 4:26:59

Luckysheet单元格数据验证功能深度解析:从入门到实战完整指南

还在为表格数据混乱、格式错误而烦恼吗?你是否遇到过员工填写表单时输入无效的手机号,或者财务报表中出现不合理的数值范围?这些问题不仅影响数据质量,还会给后续的数据分析带来巨大困扰。Luckysheet的数据验证功能正是解决这些问…

作者头像 李华
网站建设 2026/2/26 18:01:36

工业互联网Agent设备认证安全方案(三大高危漏洞防御策略)

第一章:工业互联网Agent设备管理概述在工业互联网体系中,Agent作为部署于边缘设备端的核心组件,承担着数据采集、协议转换、本地决策与云端协同的关键职责。它不仅实现了物理设备与数字平台之间的无缝连接,还通过轻量级运行时环境…

作者头像 李华