1

PDFファイルを生成するか、Tj演算子を使用して文字列をTlで表し、テキストの先頭を示す既存のPDFファイルを変換したいのですが、TJ演算子とTD演算子を含めるべきではありません。acrobat distillerserver6.0.1またはadobeillustratorの設定で設定する必要があるもの。この問題で私を助けてください。

現在、私はこれらの演算子を使用してテキストを識別および検索し、目的のために辞書として保存しています。

4

1 に答える 1

0

Distillerはそのようなものをサポートしていないと思います。

テキストを抽出するためのより良い方法を見つけることをお勧めします。他のテキスト表示演算子(TJだけでなく)の代わりにすべてのテキストを使用してTjいる場合でも、カスタムエンコーディングに遭遇すると問題が発生します。すでにこの問題を解決している他の誰かにあなたのためにそれをさせてください。

PDFからテキストを抽出するのにかなり良い仕事をすることができるプログラムがたくさんあります。最高のものはまだAcrobat/Readerです...したがって、Readerからテキストを選択/コピー/貼り付けできない場合、他のソフトウェアも機能しません... OCR(O potical C haracter R ecognition )を保存します。

私はiText(Java)とiTextSharp (C#)に偏っています...私はコミッターです。それでもなお、基本的に同じことをしている他のアプリケーションはかなりたくさんあります...フリーウェア/フリーソフトウェア/商用スペクトルのさまざまな場所にあります。ちなみに、iTextはそのスペクトルのいくつかの場所にあります。:rolleyes:

于 2011-06-06T17:10:13.370 に答える