新华通讯社主管

首页 >> 正文

MiniMax发布M3模型 AI大模型竞争转向长上下文与智能体能力
2026-06-01 记者 郭倩 来源:经济参考网

6月1日,国产大模型公司MiniMax正式发布新一代通用模型MiniMax M3。M3采用全新的自研稀疏注意力架构MiniMax Sparse Attention(MSA),在编程及智能体能力、超长上下文及原生多模态等多个关键方向,均实现代际突破。据悉,M3是同时具备“前沿Coding能力、1M超长上下文、原生多模态”三项核心能力的大模型。

据介绍,支撑M3三大能力合一的,是其自研的稀疏注意力架构MSA(MiniMax Sparse Attention)。相较传统全注意力机制,MSA能够显著降低长上下文下的计算成本,并将上下文窗口提升至100万token(词元)。这意味着模型在处理长文档、复杂代码仓库、多轮任务协作等场景时,能够在一次推理中保留更完整的信息链路。据MiniMax方面披露,在100万上下文规模下,M3单token计算量仅为上一代模型的约1/20,推理效率显著提升。

除模型架构升级外,MiniMax在底层推理算子层面也进行了进一步优化。通过重新设计数据读取与计算路径,相关性能较主流开源方案提升4倍以上。

在业内看来,这也是全球大模型竞赛的重要新变量。随着Agent任务复杂度不断提高,“更长上下文、更稳定记忆、更低成本推理”正在成为决定产品可用性的关键能力。

与此同时,M3在Coding&Agentic(编程与自主智能)能力明显提升,在涵盖软件工程、终端执行、效率与协议理解等多个维度的国际权威评测中,均达到国际领先水平。据介绍,M3在编程与Agent训练中创新引入交互式用户模拟器框架——通过模拟真实开发者在协作过程中的行为模式,让模型在训练和评测阶段就接触到更接近生产环境的交互场景。

商业化方面,MiniMax同步推出Token Plan订阅方案。Plus版每月49元,提供6亿token;Max版每月119元,提供18亿token;Ultra版每月469元,提供55亿token。

业界分析认为,从代码开发、研究分析,到跨应用协同执行,Coding&Agentic能力正逐步成为全球头部模型的新竞争焦点。此次MiniMax重点强化这一能力,也被外界视为对下一阶段AI产品形态的提前布局。

凡标注来源为“经济参考报”或“经济参考网”的所有文字、图片、音视频稿件,及电子杂志等数字媒体产品,版权均属《经济参考报》社有限责任公司,未经书面授权,不得以任何形式刊载、播放。获取授权

《经济参考报》社有限责任公司版权所有 本站所有新闻内容未经协议授权,禁止转载使用

新闻线索提供热线:010-63074375 63072334 报社地址:北京市宣武门西大街57号

JJCKB.CN 京ICP备2024066810号-1