OCR — Extraire le texte des PDF numérisés
Lancez l'OCR sur des PDF issus d'images pour les rendre recherchables et copiables. 13 langues prises en charge.
Déposez un PDF numérisé pour l'OCR
ou cliquez pour sélectionner · jusqu'à 100 Mo
Choisissez la langue du texte dans le PDF. Les options combinées permettent de mélanger des langues (par ex. chinois + anglais).
Remarque : L'OCR s'exécute entièrement dans votre navigateur (Tesseract.js via WebAssembly). La première utilisation télécharge le moteur OCR et les données linguistiques — ensuite, c'est mis en cache. Les numérisations à plus haute résolution offrent une bien meilleure précision.
Autres outils PDF
Questions fréquentes
Quelle est la précision de l'OCR ?
Très précise sur les numérisations nettes (90 %+). Moindre sur les numérisations basse résolution, inclinées ou bruitées. Pour de meilleurs résultats, numérisez à 300 DPI et gardez les pages droites.
Puis-je utiliser plusieurs langues ?
Oui — choisissez une option combinée comme « 繁中 + English » dans la liste des langues. Utile pour les documents bilingues.
Pourquoi la première exécution est-elle lente ?
Le moteur OCR (~5 Mo) et les données linguistiques (~2-10 Mo par langue) sont téléchargés à la première utilisation. Les exécutions suivantes utilisent le cache du navigateur et sont bien plus rapides.