PDFからすべてのテキストを削除/削除するための解決策を探しています。私はしばらくの間iTextSharpを使用していて、それを使用してpdfからテキストを抽出するのは簡単です(OCRを使用すると)。ただし、テキストを削除するオプションが見つかりません。
この解決策は率直に言って私にはうまくいきません。
page.GetAsArray(PdfName.CONTENTS);
PdfName.Text
私が試した他のいくつかを使用しているときも、nullを返します。
使用するライブラリは実際には重要ではありません。iTextsharpがこれを実行できるはずだと思います。ただし、別の(無料の)解決策がある場合は、それを持参してください
編集:PDFからすべてのテキストを削除したい理由を明確にするためだけに
PDFのサイズを小さくしたい。これを行うには、PDFの画像の解像度を下げます。ただし、多くの場合、ベクター画像がスペースの大部分を占めます。そこで、次のことを考えました。残りのpdf(画像とベクトルのみを含む)をビットマップ(jpeg)に変換するよりも、すべてのテキストを削除します。その後、テキストをもう一度貼り付けます。もう1つのオプションは、テキストを非表示にすることですが、これは簡単ではないと思います。