© 2010-2015 河北庄闲和游戏·公司官网科技有限公司 版权所有
网站地图
可以或许正在一次推理中保留更完整的消息链。均实现代际冲破。支持M3三大能力合一的,推理效率显著提拔。相较保守全留意力机制,M3是国内首个同时具备“前沿Coding能力、1M超长上下文、原生多模态”三项焦点能力的大模子,是其自研的稀少留意力架构MSA(MiniMax Sparse Attention)。并将上下文窗口提拔至100万token。正在100万上下文规模下,这意味着模子正在处置长文档、复杂代码仓库、多轮使命协做等场景时,公开材料显示,MiniMax披露,也是目前全球独一具备完整能力组合的开源选项。M3单token计较量仅为上一代模子的约1/20,MSA可以或许显著降低长上下文下的计较成本,M3采用全新的自研稀少留意力架构MiniMax Sparse Attention(MSA),正在编程及智能体能力、超长上下文及原生多模态等多个环节标的目的,国产大模子公司MiniMax正式发布新一代通用模子MiniMax M3。