0

ページの右上と左上にセキュリティ マークがある PDF ファイルを .pdb ファイルに変換して携帯電話で読み取ると、セキュリティ マークの書き込みが .pdb ファイルに挿入され、数ページごとに次のようになります。

PDF Transform

PDF Transform

Y

Y

Y

er

Y

er

B

2

B

2

B

.0

B

.0

A

A

Click here to buy

Click here to buy

w

w

w

w

w .

w

A B B YY.com

.A B BYY.com

を使用して複数の種類のファイルに変換しようとしましcalibreたが、すべてに表示されます。

それらを.txtファイルに変換した場合、複数のファイルでこれらのテキスト行を消去するバッチ ファイルを作成できる人はいますか?

4

1 に答える 1

0

どのOSを使用しているかはわかりませんが、これは* nix、SEDがインストールされたosxで動作します。WindowsでSEDを使用できるかどうかはわかりません:

for filename in *.txt; do sed ${filename} -e '1,20d' -e '/^PDF Transform/,/^A B B YY\.com/d' > newfiles/${filename}; done

最初の -e コマンドは、それが静的なものであり、ファイル内の同じ位置にあることがわかっている場合、行 1 ~ 20 を削除します。2 番目の -e コマンドは、これらの行を含む PDF Transform と YY.com の間のすべてを削除します。多くまたは 1 つの -e コマンドを使用して、必要なものを取得できます。newfiles フォルダーが存在することを前提としています。私はこれをテストしなかったので、正規表現がオフになっている可能性があります。

于 2012-09-18T04:13:15.840 に答える