OCR — извлечение текста из отсканированных PDF

Запустите OCR на PDF-файлах с изображениями, чтобы сделать их доступными для поиска и копирования. Поддерживается 13 языков.

Перетащите отсканированный PDF для OCR

или нажмите для выбора · до 100 МБ

Примечание: OCR выполняется полностью в вашем браузере (Tesseract.js через WebAssembly). При первом использовании загружаются движок OCR и языковые данные — после этого они кэшируются. Сканы высокого разрешения дают гораздо лучшую точность.

Другие инструменты для PDF

Объединение PDF Разделение PDF Сжатие PDF Упорядочивание PDF Поворот PDF PDF в изображение Изображение в PDF PDF в текст Водяной знак на PDF Подпись PDF Шифрование PDF Разблокировка PDF Номера страниц Колонтитулы Обрезка PDF Извлечение изображений Редактирование PDF Сведения о PDF PDF в Word Word в PDF PDF в Excel Excel в PDF PDF в PowerPoint HTML в PDF

Часто задаваемые вопросы

Насколько точен OCR?

Очень точен на чистых сканах (90%+). Ниже на сканах с низким разрешением, перекошенных или зашумлённых. Для лучших результатов сканируйте с 300 DPI и держите страницы прямо.

Можно ли использовать несколько языков?

Да — выберите комбинированный вариант, например «繁中 + English», из списка языков. Это полезно для двуязычных документов.

Почему первый запуск медленный?

Движок OCR (~5 МБ) и языковые данные (~2-10 МБ на язык) загружаются при первом использовании. Последующие запуски используют кэш браузера и работают гораздо быстрее.