2026世界杯-最新版官方软件百度最强视觉识别模子来了！仅0.9B，文档领路智商卓绝Gemini、GPT

智东西6月2日报谈，近日，负责发布文心滋生视觉识别模子PaddleOCR-VL-1.6。

在泰斗文档领路智商评测集OmniDocBench v1.6上，PaddleOCR-VL-1.6共诡计达到96.33%，卓绝Gemini-3-Pro、GPT-5.2、MinerU-2.5-Pro、GLM-OCR等，笼统性能第一。

在面向简直复杂场景构建的Real5-OmniDocBench评测中，PaddleOCR-VL-1.6共诡计达到93.19%，较 Gemini-3-Pro擢升近4%，在扫描件、弯折文档、屏幕拍照、光照变化及歪斜文档等五大简直场景下均进展较优。

实测数据标明，相较于市面主流开源、闭源识别模子，PaddleOCR-VL-1.6在老例笔墨、数学公式、表格三大基础识别维度笼统进展更优。

针对表格领路、繁体古籍、冷僻用字等高难度识别场景，该模子后果较上一代彰着优化，钤记甄别、笔墨定位、图表信息索要等细分任务性能也同步改善，不错适配各类文档数字化落地场景的骨子使用条目。

现在，2026世界杯中国压球官网PaddleOCR-VL-1.6已上线PaddleOCR官网，撑握网页端和API调用。同期，模子代码及权重已同步开源至GitHub和Hugging Face。

开云体育世界杯中国官网首页

PaddleOCR官网：paddleocr.com

Github：github.com/PaddlePaddle/PaddleOCR

HuggingFace：huggingface.co/PaddlePaddle/PaddleOCR-VL-1.6

据文心团队先容，PaddleOCR基于文心大模子锻练而来，是文心大模子多模态智商的紧迫部分，撑握超100种谈话识别，用户隐敝170多个国度和地区。

这次发布的PaddleOCR-VL-1.6，基于PaddleOCR-VL-1.5蜕变通过模子开动的数据构建机制和渐进式锻练优化，在保握0.9B轻量化架构的情况下，模子准确率和复杂场景允洽智商进一步擢升。

由于两代模子模子结构一致，设立者和企业用户无需进行格外适配，即可平滑迁徙。

连年来，百度先后推出PaddleOCR-VL、PaddleOCR-VL-1.5等多款模子。PaddleOCR的GitHub星数已梗阻79.2K，越过谷歌开源OCR形势Tesseract OCR。

2026世界杯-最新版官方软件 百度最强视觉识别模子来了！仅0.9B，文档领路智商卓绝Gemini、GPT