科技 > 精品深读 > 正文

DeepSeek开源3B OCR模型：97%精度刷新长文本压缩极限

快科技

下载客户端
独家抢先看

2025年10月21日 08:36:54 来自河南

快科技10月21日消息，据媒体报道，DeepSeek在GitHub上开源了其最新研究成果——DeepSeek-OCR模型。

据介绍，DeepSeek-OCR的参数量约为3B，是研究团队对“光学二维映射压缩”技术在长文本上下文处理中可行性的首次探索。

DeepSeek开源3B OCR模型：97%精度刷新长文本压缩极限

该模型核心由DeepEncoder与DeepSeek3B-MoE-A570M解码器构成：DeepEncoder能够在高分辨率输入条件下保持低激活状态，实现高压缩比并生成适量的视觉token；解码器则负责将这些视觉token准确转化为文本信息。

实验数据显示，当文本token数量控制在视觉token的10倍以内（压缩率<10 x ）时，OCR识别精度可达97%；即使压缩率提升至20×，模型准确率仍能维持在60%左右。

研究团队表示，这一成果为长上下文压缩技术以及大语言模型的记忆与遗忘机制研究提供了新的思路与方向。

DeepSeek开源3B OCR模型：97%精度刷新长文本压缩极限

“特别声明：以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布，本平台仅提供信息存储空间服务。

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”

DeepSeek开源3B OCR模型：97%精度刷新长文本压缩极限

亲爱的凤凰网用户:

第三方浏览器推荐: