标签：token 文本解码器上下文模型压缩率视觉 github

DeepSeek开源3B OCR模型：97%精度刷新长文本压缩极限

（由多段落组成）：近日，人工智能领域再迎重要突破。据科技媒体报道，DeepSeek团队在GitHub平台正式开源了其最新研发的OCR模型——DeepSeek-OCR，引发业界广泛关注。该模型凭借创新的技术架构和出色的文本识别能力，为长文本场景下的光学字符识别提供了全新的解决方案。 DeepSeek-OCR模型参数规模约为30亿（3B），是研究团队首次将“光学二维映射压缩”技术应用于长上下文处理中的实践探索。这一技术的核心目标是在保证识别精度的同时，显著降低视觉信息的冗余度，提升处理效率。模型整体采用双模块设计：前端为DeepEncoder...

来源：

iFeng科技【阅读原文】 Tags：token 文本解码器上下文模型压缩率视觉 github

9个月前

标签：token 文本 解码器 上下文 模型 压缩率 视觉 github

DeepSeek开源3B OCR模型：97%精度刷新长文本压缩极限

标签：token 文本解码器上下文模型压缩率视觉 github