从 PDF 提取文本
把 PDF 里的文字以纯文本形式抽出来 — 可复制或下载.txt。
把 PDF 拖到这里提取文本
或点击选择文件 · 上限 100 MB
处理中…
0%
其他 PDF 工具
常见问题
为什么某些文字是乱码或丢失了?
如果 PDF 其实是扫描的图片,就没有「真正的文字」可以提取。需要 OCR 才行(暂未支持)。
会保留格式吗?
不会 — 只返回纯文本,字体、颜色、版面都会舍弃。
为什么输出看起来像一大坨字?
pdf.js 会按阅读顺序给出文字但没有换行。试试「空行」分隔符会更易读。