0

私は、C# を介して PDF を操作するためのいくつかのサードパーティ コンポーネントを調査しています。これらは Aspose.pdf.net と iTextSharp です。以下は、私がそれらを調査していることの詳細です。

人名、市区町村などの機密情報をテキスト形式で含む PDF があります。これらの PDF は別のコピーに複製する必要がありますが、複製コピーを作成する際に、機密テキストを検索してダミー テキストに置き換える必要があります。不正な手段による元の情報の追跡を避けるために、交換は不可欠です。また、置き換えられたテキストは編集する必要があります。

マスキングが必要なテキストのバリエーションが存在する可能性があるため、テキストの検索では RegEx がサポートされることが期待されます。

iTextShart を使用してこれを行う方法を教えてください。

前もって感謝します。

4

1 に答える 1

1

iTextSharp は、PdfSweep モジュール ( http://itextpdf.com/itext7/pdfsweep ) を使用して、完全なリダクション (ビジュアルと pdf に保存されたデータの両方) が可能です。テキスト検索の後に編集を行うには、次のことを行う必要があります。

  1. ドキュメントからテキストを抽出します (iText を使用して実行できます)。
  2. 抽出されたテキストを検索し、編集するテキストの位置を取得します。(あなたの側からの実装が必要です)
  3. これらの位置を使用して、PdfSweep が編集する必要がある場所を定義します。(数行のコード)

デフォルトでは、PdfSweep は場所の上に色付きのバーを描画して視覚的に編集し、テキストと画像を内部的に削除します。iText を使用して編集された位置をダミーテキストで埋めることは技術的に可能ですが、その実装には多くの落とし穴があります。

PdfSweep は iText7 のクローズド ソース モジュールです。ライセンスの詳細については、弊社の営業チームにお問い合わせください。

于 2016-09-02T13:39:22.770 に答える