科技 > 人工智能 > 正文

阿里Qwen3.7-Max模型AI编程能力超Claude Opus 4.6

IT之家

下载客户端
独家抢先看

2026年05月26日 13:52:42 来自山东

IT之家 5 月 26 日消息，全球权威三方编程榜单 Code Arena 昨日（5 月 25 日）更新榜单，阿里旗舰模型 Qwen3.7-Max 得分 1541 分，仅次于 Claude 系列，在大模型厂商中排名全球第二。

IT之家查询公开资料，Code Arena 是目前全球人工智能领域含金量最高、最权威的编程大模型（LLM）能力评估榜单之一。

该榜单不测试学术化的选择题，而是评估模型在生成、调试、重构复杂代码时的实际编程能力，此外为防止刷榜（Anti-Gaming），采用用户随机盲测，模型无法提前获知考题，让模型必须具有真实的硬核代码生成能力。

根据最新榜单成绩，阿里旗舰模型 qwen3.7-max-20260517 得分 1541 分，在全球模型榜单中排名第四，仅次于 claude-opus-4-7-thinking、claude-opus-4-7 和 claude-opus-4-6-thinking。

阿里 Qwen3.7-Max 模型的编程能力已超过 claude-opus-4-6 模型，并超过了 glm-5.1、kimi-k2.6 模型。

IT之家查询公开资料，在最新放出的 Design Arena 榜单中，阿里旗舰模型 Qwen3.7-Max 同样取得耀眼成绩，位列第十名。

Design Arena (以及其图像侧 Image Arena / LMArena) 作为一个基于真实用户盲测的 AI 模型评测平台，在当前 AI 行业中具有极高的含金量。它被认为是全球公认度最高的 AI 模型评测平台之一，被称为“AI 界的奥林匹克”。

“特别声明：以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布，本平台仅提供信息存储空间服务。

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”

阿里Qwen3.7-Max模型AI编程能力超Claude Opus 4.6

亲爱的凤凰网用户:

第三方浏览器推荐: