智谱 GLM 大模型在模型幻觉排行榜中居首近日，智谱 GLM-4-

科技 > 数码 > 正文

爱范儿

下载客户端
独家抢先看

2025年01月11日 12:17:00 来自北京

智谱 GLM 大模型在模型幻觉排行榜中居首

近日，智谱 GLM-4-9B 模型在基于幻觉评估模型 HHEM-2.1-Open 的大模型幻觉排行榜中，以 1.3% 的幻觉率排名第一。

据悉，智谱 GLM-4-9B 模型在该排行榜中，超过 OpenAI 的 GPT 系列和 Google 的 Gemini 系列在内的一众世界顶尖模型。从具体来看，智谱 GLM-4-9B 模型事实一致性率高达 98.7%，回答率 100%，幻觉率则仅有 1.3%，在参评的 85 个模型中排名第一。

据了解，智谱 GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。在语义、数学、推理、代码和知识等多方面的数据集测评中，GLM-4-9B 及其人类偏好对齐的版本 GLM-4-9B-Chat 均表现出较高的性能。

此外，大模型幻觉排行榜所使用的 HHEM 系列模型由 Vectara 开发，旨在检测大模型在总结文本内容时发生幻觉的概率。HHEM 系列模型采用了来自事实一致性研究的各种开源数据集， HHEM 会向参评的模型输入文档，评估其输出内容在幻觉和内容准确性方面的表现，并根据综合得分排名。

智谱 GLM 大模型在模型幻觉排行榜中居首近日，智谱 GLM-4-

“特别声明：以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布，本平台仅提供信息存储空间服务。

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”

亲爱的凤凰网用户:

第三方浏览器推荐: