Kimi最强编程模型来了:Token消耗直降30%,过度思考有救了,附一手实测
科技
科技 > 数码 > 正文

Kimi最强编程模型来了:Token消耗直降30%,过度思考有救了,附一手实测

智东西

作者 | 陈骏达

编辑 | 云鹏

智东西6月12日报道,今天,月之暗面发布并开源Kimi K2.7 Code编程模型,参数量达1.1万亿,提供256K上下文窗口。这一模型重点提升了长上下文编程场景的指令遵循能力、长程编程任务的性能表现,并且大幅改善了在长程任务中的过度思考倾向,平均token消耗减少30%。

Kimi最强编程模型来了:Token消耗直降30%,过度思考有救了,附一手实测

月之暗面公布的基准测试结果显示,K2.7 Code在多项编程和Agent基准测试中较K2.6实现大幅度提升,提升比例从10%-31.5%不等,不过距离GPT-5.5(xhigh)、Opus 4.8(xhigh)等模型还有一定差距。

Kimi最强编程模型来了:Token消耗直降30%,过度思考有救了,附一手实测

目前,这一模型已经上线Kimi API 开放平台(platform.kimi.com),其每百万个token的标准输入和输出价格与K2.6模型一致,分别为6.5元和27元;命中缓存的输入价格小幅度上调0.2元至1.3元。

同时,Kimi Code Plan的默认模型已同步升级为Kimi K2.7 Code。需要注意的是,使用K2.7 Code模型须打开思考模式以发挥最佳性能。Kimi API和Kmi Code均默认开启思考,如果手动关闭思考模式,API会报错,Kimi Code会回退到K2.6模型。

下周一,月之暗面还在Kimi API开放平台推出Kimi K2.7 Code高速版,并逐步面向“抢鲜体验计划”成员和Kimi会员开放。这一模型的输出速度约为普通版的5-6倍价格为2倍,常规编程场景下输出速度约180 Token/s,短上下文场景可达260 Token/s。高速版模型在Kimi Code Plan中的用量消耗是普通版模型的3倍。

K2.7 Code上线后,智东西第一时间对其进行了初步体验,实测案例以编程类为主,测试环境为VS Code+Kimi Code插件。

Kimi最强编程模型来了:Token消耗直降30%,过度思考有救了,附一手实测

我们的首个实测案例,是让K2.7 Code做一个轻量级的任务:在单个html文件的维度下,复刻一个mac OS风味的操作系统demo。这一任务主要考察K2.7 Code的前端能力。

实测过程中,能明显感受到这代Kimi模型更加果断了:由于项目不是很复杂,它没有在思考上花太多无谓的时间,迅速进入了开发工作。由于其每次生成的耗时也较短,我可以快速迭代。

最终,K2.7 Code打造的前端代码效果如下。可以看到,在逐步迭代后,这个demo的完成度不错,拥有完整的开机动画和基本功能,像是便签、浏览器都可以正常使用。

Kimi最强编程模型来了:Token消耗直降30%,过度思考有救了,附一手实测

美中不足的是,我多次让K2.7 Code修改它生成的SVG开机动画图,但是最终的效果看起来还是和苹果公司的logo没有太大关系。

Kimi最强编程模型来了:Token消耗直降30%,过度思考有救了,附一手实测

我们的下一个任务,是用K2.7 Code开发一个“智能体小镇”复刻版。智能体小镇其实是斯坦福大学与谷歌合作推出的一个多智能体交互实验项目,通过大语言模型驱动虚拟小镇中的智能体,模拟人类日常行为、社交互动及社会现象,探索AI在模拟人类行为方面的可能性。

不过,在正式开发前,我先让K2.7 Code写了份简易的PRD文档。可以看到,它的文档中既有对产品的一句话形象概述,也有对市场背景、功能架构、非功能需求和技术方案等细节的界定,能对开发工作起到指导作用。

Kimi最强编程模型来了:Token消耗直降30%,过度思考有救了,附一手实测

随后,我要求K2.7 Code在PRD文档的指导下开发一个最小可行版本(MVP)。K2.7 Code one-shot生成结果还是存在一些bug,画面无法正常渲染,于是我让它继续改进,要求它K2.7 Code进一步优化这一智能体小镇的美术设计,并将其改造为一个可以本地部署的方案。

Kimi最强编程模型来了:Token消耗直降30%,过度思考有救了,附一手实测

最终,在连续开发30多分钟后,K2.7 Code终于交付了完整可用的项目。虽然看上去有些简陋,但基本功能都实现了,接入大模型后也可以正常和智能体对话。如果后续进行更多迭代,最终效果应该还会改进。

Kimi最强编程模型来了:Token消耗直降30%,过度思考有救了,附一手实测

到项目文件夹检查后,可以看到K2.7 Code打造的项目文件架构清晰,分工合理。

Kimi最强编程模型来了:Token消耗直降30%,过度思考有救了,附一手实测

结语:编程场景,速度同样决定体验

初步体验下来,K2.7 Code给人一种更为果断的感受,过去那种在简单任务上反复自我质疑、长篇大论地思考,然后再动手的问题少了很多。

在生成速度方面,K2.7 Code的优化也比较贴合当下的行业趋势。近期国内不少大模型厂商都在推高速模型,Kimi此次也同步预告了5到6倍速的高速版。

这种提速不是偶然的,在编程这一高频交互的场景里看,速度本身就是一种关键的用户体验。

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载