科技 > 人工智能 > 正文

稀宇科技发布并开源新一代MiniMax 01系列模型，参数量达4560亿

IT之家

下载客户端
独家抢先看

2025年01月15日 13:50:39 来自山东

IT之家 1 月 15 日消息，稀宇科技（MiniMax）今日宣布推出新一代 01 系列模型，包含基础语言大模型 MiniMax-Text-01 和视觉多模态大模型 MiniMax-VL-01。

为方便开发者研究，该公司还在 Github 上开源了两个模型的完整权重。这一系列模型的后续更新，包括代码和多模态相关的后续强化仍待上传。

该系列模型首次大规模实现线性注意力机制，打破 Transformer 传统架构记忆瓶颈，能够处理 400 万 token 的输入，可输入长度是 GPT-4o 的 32 倍，Claude-3.5-Sonnet 的 20 倍。

据介绍，这个模型的参数量高达 4560 亿，其中单次激活 459 亿，模型综合性能比肩海外顶尖模型，在大多数任务上追平了海外公认最先进的两个模型，GPT-4o-1120 以及 Claude-3.5-Sonnet-1022。

在长文任务上，随着输入长度变长，MiniMax-Text-01 性能衰减更少，显著优于谷歌 Gemini。因此，01 系列模型在处理长输入的时候有非常高的效率，接近线性复杂度。

定价方面，IT之家发现该系列模型标准定价是输入 1 元 / 百万输入 token、8 元 / 百万输出 token。

“特别声明：以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布，本平台仅提供信息存储空间服务。

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”

稀宇科技发布并开源新一代MiniMax 01系列模型，参数量达4560亿

亲爱的凤凰网用户:

第三方浏览器推荐: