OCR — スキャンされたPDFからテキストを抽出
画像ベースのPDFにOCRを実行し、検索・コピー可能にします。13言語対応。
OCRするスキャンPDFをドロップ
またはクリックで選択 · 最大100 MB
PDFのテキスト言語を選択してください。組み合わせオプションで複数言語を混在させられます(例:中国語+英語)。
処理中…
0%
注意: OCRはブラウザ内で完全に動作します(WebAssembly経由のTesseract.js)。初回はOCRエンジンと言語データがダウンロードされますが、以降はキャッシュされます。高解像度のスキャンほど精度が向上します。
その他のPDFツール
よくある質問
OCRの精度はどの程度?
きれいなスキャンなら非常に高精度(90%以上)。低解像度、傾き、ノイズが多いスキャンでは低下します。最良の結果を得るには、300 DPIでページを真っ直ぐスキャンしてください。
複数言語を使用できますか?
はい — 言語リストから「繁中 + English」のような組み合わせオプションを選択してください。バイリンガル文書に便利です。
初回の処理が遅いのはなぜ?
OCRエンジン(約5 MB)と言語データ(1言語あたり約2~10 MB)が初回使用時にダウンロードされます。以降はブラウザキャッシュを使用し、はるかに高速になります。