スキャナーで読み込んだ原稿を本機でOCR処理し、テキストデータをPDFに埋め込みます。
この機能を使用するために必要なオプションについては、『本機のご利用にあたって』「オプションが必要な機能一覧」を参照してください。
本機能で使用できるファイル形式は[PDF]、またはPDFファイル設定の[クリアライトPDF]、[PDF/A]です。
[読み取り条件]の[原稿種類]タブで[白黒:写真]を設定して原稿を読み取ると、文字に階調処理がかかるため文字や天地が正しく識別されないことがあります。OCR処理を優先するときは、[読み取り条件]の[原稿種類]タブで[白黒:文字]を設定して読み取ることをお勧めします。
以下のときは設定できません。
ファイル形式で[TIFF/JPEG]または[TIFF]が選択されているとき
解像度に[100 dpi]が選択されているとき
WSDまたはDSMの宛先を使用しているとき
本機能は、やさしくスキャナー機能でも使用できます。やさしくシリーズの操作画面の使いかたについては、『やさしくコピー/やさしくファクス/やさしくスキャナー』「やさしくスキャナー画面」を参照してください。
[ファイル形式/ファイル名]を押します。
「ファイル形式」で[PDF]を押します。
PDFファイル設定の[OCR設定]を選択し、[する]を押します。
必要に応じて[自動ファイル名追加]、[白紙除去]または[認識言語]を設定します。
[OK]を2回押します。
OCR処理できる文字数は、1ページあたり約4万文字です。
OCRで認識できる言語は、以下のとおりです。
英語、ドイツ語、フランス語、イタリア語、スペイン語、オランダ語、ポルトガル語、ポーランド語、スウェーデン語、フィンランド語、ハンガリー語、ノルウェー語、デンマーク語、日本語
200dpi以上の解像度で読み取りをしても、変倍設定で縮小すると実質的な解像度が200dpi未満となることがあります。このようなときでもOCR処理は実行されますが、OCRの認識精度が低下します。
[文書蓄積]で[本体に蓄積]を選択したときは、[自動ファイル名追加]は選択できません。
文字の形や種類によっては正しく認識できないことがあります。
文字として認識される個所がないページは、通常のPDFとして生成されます。
白紙の部分が多いページは天地が正しく認識できないことがあります。
全ページが白紙として検知されると、PDFファイルは生成されません。PDFファイルが生成されないときは、原稿のセット方法を確認してください。
原稿の裏写りや汚れによって、白紙が白紙として検知されないことがあります。また、天地が正しく認識できないことがあります。
OCR処理をしているときに原稿のフォントを判別しないため、原稿の文字幅と埋め込むテキストの文字幅の差異によって、埋め込まれたテキストの位置がずれることがあります。
全角と半角を誤って認識することがあります。PDFに埋め込まれたテキストを閲覧ソフトで検索するときは、全角と半角を区別しない設定にしてください。
OCRを設定し、連続して読み取るときは、2番目以降に読み取る原稿の用紙サイズや解像度によって、読み取り開始に時間がかかります。