从 PDF 提取文本

把 PDF 里的文字以纯文本形式抽出来 — 可复制或下载.txt。

把 PDF 拖到这里提取文本

或点击选择文件 · 上限 100 MB

其他 PDF 工具

PDF 合并 PDF 拆分 PDF 压缩 PDF 整理 PDF 旋转 PDF 转图片图片转 PDF 加水印 PDF 签名 PDF 加密 PDF 解锁 PDF OCR 加页码页眉页脚 PDF 裁剪抽取图片 PDF 涂黑 PDF 查看 PDF 转 Word Word 转 PDF PDF 转 Excel Excel 转 PDF PDF 转 PowerPoint HTML 转 PDF

常见问题

为什么某些文字是乱码或丢失了?

如果 PDF 其实是扫描的图片,就没有「真正的文字」可以提取。需要 OCR 才行(暂未支持)。

会保留格式吗?

不会 — 只返回纯文本,字体、颜色、版面都会舍弃。

为什么输出看起来像一大坨字?

pdf.js 会按阅读顺序给出文字但没有换行。试试「空行」分隔符会更易读。