OCR — Text aus gescannten PDFs extrahieren

Mach bildbasierte PDFs per OCR durchsuchbar und kopierbar. Unterstützt 13 Sprachen.

Gescanntes PDF für OCR ablegen

oder zum Auswählen klicken · bis zu 100 MB

Hinweis: OCR läuft komplett in deinem Browser (Tesseract.js via WebAssembly). Beim ersten Einsatz werden OCR-Engine und Sprachdaten heruntergeladen — danach sind sie gecached. Höhere Scan-Auflösungen liefern deutlich bessere Genauigkeit.

Weitere PDF-Tools

PDF zusammenführen PDF teilen PDF komprimieren PDF organisieren PDF drehen PDF zu Bild Bild zu PDF PDF zu Text Wasserzeichen einfügen PDF unterschreiben PDF verschlüsseln PDF entsperren Seitenzahlen Kopf- & Fußzeile PDF zuschneiden Bilder extrahieren PDF schwärzen PDF-Info PDF zu Word Word zu PDF PDF zu Excel Excel zu PDF PDF zu PowerPoint HTML zu PDF

Häufig gestellte Fragen

Wie genau ist die OCR?

Sehr genau bei sauberen Scans (90 %+). Schlechter bei niedriger Auflösung, schiefen oder verrauschten Scans. Für beste Ergebnisse mit 300 DPI scannen und Seiten gerade halten.

Kann ich mehrere Sprachen verwenden?

Ja — wähle eine kombinierte Option wie „繁中 + English“ aus der Sprachliste. Das ist praktisch für zweisprachige Dokumente.

Warum ist der erste Durchlauf langsam?

Die OCR-Engine (~5 MB) und die Sprachdaten (~2-10 MB pro Sprache) werden beim ersten Einsatz heruntergeladen. Spätere Durchläufe nutzen den Browser-Cache und sind viel schneller.