pdf - 不正に作成されたLaTeXソースからのPDFのインデックス作成

翻译自：https://stackoverflow.com/questions/14474405 2013-01-23T07:22:23.010

816 次

LaTeXソースに由来するいくつかのPDFファイルでこの問題に気づきました（ページのレイアウト/デザインと使用されているフォントからだと思います）。

そのため、今日私はそのような記事を読んでいて、意味のあるテキストをコピーすることも、テキスト検索を行うこともできず、もちろんドキュメントのインデックスを作成することもできませんでした。これが1つのランダムな例です：http ：//www.vincent-net.com/luc/papers/00informatica_granul.pdf

いくつかの手順はありますか、私はこの種の文書にアクセスできるようにすることができます。私の頭に浮かぶのは、ドキュメントをラスタライズしてから、保存するときにOCRを実行することだけですが、それはばかげていると感じます。

pdf - 不正に作成されたLaTeXソースからのPDFのインデックス作成

0 に答える 0

Related

Reference