PDFをテキストに変換する必要があり、現在使用していpdftotext.exe
ます。これにより、結果のテキストが時々台無しになるため、使用できません。
別のプログラムから呼び出すことができる別の無料ツールはありますか? コマンドラインツールの方がいいです。
PDF は、その構成方法によってはテキストに変換するのが難しい場合がありますが、iTextSharp や GhostScript、または商用コンポーネントから良い結果が得られる場合があります。
通常、PDF ファイルには構造が含まれていないため、ソフトウェアはそれを推測する必要があります。私はhttp://www.jpedal.org/PDFblog/2009/04/pdf-text/で問題に関するブログ投稿を書きました
PdfBox を試すこともできます。