为什么选择DeepSeek-OCR-2做本地OCR?
在接触DeepSeek-OCR-2之前,我试过Tesseract、PaddleOCR,甚至付费用过ABBYY FineReader。说实话,它们在处理标准印刷体时表现还行,但一旦遇到复杂版式——比如古籍扫描件、手写笔记、带有表格和公式的学术文档——识别率就断崖式下跌。
我印象最深的一次是帮朋友数字化一本民国时期的家谱。扫描件泛黄、字迹模糊、排版复杂(竖排+批注)。用传统OCR工具,识别结果简直惨不忍睹:文字错位、标点符号...
古籍数字化
-
2026.05.25 | youres | 14次围观

