OCR — Text aus gescannten PDFs extrahieren
Mach bildbasierte PDFs per OCR durchsuchbar und kopierbar. Unterstützt 13 Sprachen.
Gescanntes PDF für OCR ablegen
oder zum Auswählen klicken · bis zu 100 MB
Wähle die Sprache des Textes im PDF. Kombinierte Optionen erlauben das Mischen von Sprachen (z. B. Chinesisch + Englisch).
Hinweis: OCR läuft komplett in deinem Browser (Tesseract.js via WebAssembly). Beim ersten Einsatz werden OCR-Engine und Sprachdaten heruntergeladen — danach sind sie gecached. Höhere Scan-Auflösungen liefern deutlich bessere Genauigkeit.
Weitere PDF-Tools
Häufig gestellte Fragen
Wie genau ist die OCR?
Sehr genau bei sauberen Scans (90 %+). Schlechter bei niedriger Auflösung, schiefen oder verrauschten Scans. Für beste Ergebnisse mit 300 DPI scannen und Seiten gerade halten.
Kann ich mehrere Sprachen verwenden?
Ja — wähle eine kombinierte Option wie „繁中 + English“ aus der Sprachliste. Das ist praktisch für zweisprachige Dokumente.
Warum ist der erste Durchlauf langsam?
Die OCR-Engine (~5 MB) und die Sprachdaten (~2-10 MB pro Sprache) werden beim ersten Einsatz heruntergeladen. Spätere Durchläufe nutzen den Browser-Cache und sind viel schneller.