OCR — Extraire le texte des PDF numérisés

Lancez l'OCR sur des PDF issus d'images pour les rendre recherchables et copiables. 13 langues prises en charge.

Déposez un PDF numérisé pour l'OCR

ou cliquez pour sélectionner · jusqu'à 100 Mo

Remarque : L'OCR s'exécute entièrement dans votre navigateur (Tesseract.js via WebAssembly). La première utilisation télécharge le moteur OCR et les données linguistiques — ensuite, c'est mis en cache. Les numérisations à plus haute résolution offrent une bien meilleure précision.

Autres outils PDF

Fusion de PDF Division de PDF Compression de PDF Organiser PDF Pivoter PDF PDF vers Image Image vers PDF PDF vers Texte Filigrane PDF Signer PDF Chiffrer PDF Déverrouiller PDF Numéros de page En-tête et pied de page Rogner PDF Extraire les images Caviarder PDF Infos PDF PDF vers Word Word vers PDF PDF vers Excel Excel vers PDF PDF vers PowerPoint HTML vers PDF

Questions fréquentes

Quelle est la précision de l'OCR ?

Très précise sur les numérisations nettes (90 %+). Moindre sur les numérisations basse résolution, inclinées ou bruitées. Pour de meilleurs résultats, numérisez à 300 DPI et gardez les pages droites.

Puis-je utiliser plusieurs langues ?

Oui — choisissez une option combinée comme « 繁中 + English » dans la liste des langues. Utile pour les documents bilingues.

Pourquoi la première exécution est-elle lente ?

Le moteur OCR (~5 Mo) et les données linguistiques (~2-10 Mo par langue) sont téléchargés à la première utilisation. Les exécutions suivantes utilisent le cache du navigateur et sont bien plus rapides.