PDF Tools

OCR — Extraire le texte des PDF numérisés

Lancez l'OCR sur des PDF issus d'images pour les rendre recherchables et copiables. 13 langues prises en charge.

Déposez un PDF numérisé pour l'OCR

ou cliquez pour sélectionner · jusqu'à 100 Mo

Remarque : L'OCR s'exécute entièrement dans votre navigateur (Tesseract.js via WebAssembly). La première utilisation télécharge le moteur OCR et les données linguistiques — ensuite, c'est mis en cache. Les numérisations à plus haute résolution offrent une bien meilleure précision.

Autres outils PDF

Questions fréquentes

Quelle est la précision de l'OCR ?

Très précise sur les numérisations nettes (90 %+). Moindre sur les numérisations basse résolution, inclinées ou bruitées. Pour de meilleurs résultats, numérisez à 300 DPI et gardez les pages droites.

Puis-je utiliser plusieurs langues ?

Oui — choisissez une option combinée comme « 繁中 + English » dans la liste des langues. Utile pour les documents bilingues.

Pourquoi la première exécution est-elle lente ?

Le moteur OCR (~5 Mo) et les données linguistiques (~2-10 Mo par langue) sont téléchargés à la première utilisation. Les exécutions suivantes utilisent le cache du navigateur et sont bien plus rapides.