OCR - yanagiyaのブログ

スキャナーを使って文字認識をすることだが、同じフロアに居室を構える先生の研究室の大学院生から相談をうけた。この学生さん、私とは違いマネジメント系の領域の所属だが、これまでにも私の仕事を手伝ってもらったりもしたのだがちょっと助けてあげることにした。とはいえ、ここ数年、OCRなんて使っていないから出来るのだろうかと思いつつ、実際にやってみた。
私も、特にOCR専用ソフトを所有しているわけでも無いので、スキャナーで読み取ったPDFをADOBE ACROBAT で認識するという方法を選択した。試しに、PDFでは配信されていないような紙媒体の論文をPDFにしたものを、「OCRテキスト認識」というメニューから文字認識させた。それを「選択ツール」で文字をコピーしてワードに貼付けてみると、ちゃんと文字として間違いなくコピーされている。使うかどうかはわからないが、この機能、すばらしい。