标签:token 文本 解码器 上下文 模型 压缩率 视觉 github
DeepSeek开源3B OCR模型:97%精度刷新长文本压缩极限
(由多段落组成): 近日,人工智能领域再迎重要突破。据科技媒体报道,DeepSeek团队在GitHub平台正式开源了其最新研发的OCR模型——DeepSeek-OCR,引发业界广泛关注。该模型凭借创新的技术架构和出色的文本识别能力,为长文本场景下的光学字符识别提供了全新的解决方案。 DeepSeek-OCR模型参数规模约为30亿(3B),是研究团队首次将“光学二维映射压缩”技术应用于长上下文处理中的实践探索。这一技术的核心目标是在保证识别精度的同时,显著降低视觉信息的冗余度,提升处理效率。模型整体采用双模块设计:前端为DeepEncoder...