OCR — 从扫描 PDF 提取文本

对图片形式的 PDF 执行 OCR,让它变成可搜索、可复制。支持 13 种语言。

把扫描的 PDF 拖到这里

或点击选择文件 · 上限 100 MB

注意: OCR 完全在浏览器中运行(Tesseract.js + WebAssembly)。首次使用会下载 OCR 引擎与语言数据,之后会从浏览器缓存读取。300 DPI 以上的扫描效果最好。

其他 PDF 工具

OCR 准确度如何?

干净的扫描件可达 90% 以上。低分辨率、倾斜、噪点多的扫描会较低。最佳效果建议 300 DPI 并尽量摆正。

可以同时识别多种语言吗?

可以 — 从语言菜单选「简中 + English」等组合选项。适用于双语文档。

为什么第一次特别慢?

OCR 引擎(约 5 MB)和语言数据(每种语言约 2-10 MB)会在第一次使用时下载。之后会用浏览器缓存,快很多。