OCR — スキャンされたPDFからテキストを抽出

画像ベースのPDFにOCRを実行し、検索・コピー可能にします。13言語対応。

OCRするスキャンPDFをドロップ

またはクリックで選択 · 最大100 MB

注意: OCRはブラウザ内で完全に動作します(WebAssembly経由のTesseract.js)。初回はOCRエンジンと言語データがダウンロードされますが、以降はキャッシュされます。高解像度のスキャンほど精度が向上します。

その他のPDFツール

OCRの精度はどの程度?

きれいなスキャンなら非常に高精度(90%以上)。低解像度、傾き、ノイズが多いスキャンでは低下します。最良の結果を得るには、300 DPIでページを真っ直ぐスキャンしてください。

複数言語を使用できますか?

はい — 言語リストから「繁中 + English」のような組み合わせオプションを選択してください。バイリンガル文書に便利です。

初回の処理が遅いのはなぜ?

OCRエンジン(約5 MB)と言語データ(1言語あたり約2~10 MB)が初回使用時にダウンロードされます。以降はブラウザキャッシュを使用し、はるかに高速になります。