0

こんにちは、Ruby 1.9.3 で PDF を txt ファイルに変換します

txt ファイルの一部を次に示します。

    [["Rate", "Card", "February", "29,", "2012"]]
    [["Termination", "Color", "Test", "No", "Rate", "Currency", "Notes"]]
    [["x", "A", "CAMEL", "56731973573", "$", "0.1400", "USD", "30/45/100%"]]
    ["y", "A", "CARDINAL", "56731972501", "$", "0.1400", "USD", "30/45/100%"]]
    [["z", "A", "CARNELIAN", "56731971654", "$", "0.1400", "USD", "30/45/100%"]]
    .....
    ....
    [["Rate", "Card", "February", "29,", "2012"]]
    [["Termination", "Color", "Test", "No", "Rate", "Currency", "Notes"]]

すべての行を異なる配列に保存しますが、問題は、txt ファイルに何度も表示される最初の 2 行を読みたくないということです。これらの行は、pdf のすべてのページのヘッダーであるためです。それを行う方法について何か考えはありますか?ありがとう!

4

1 に答える 1

0

ファイルを配列に読み込み、不要な行を拒否できます。

rejected = [
  '[["Rate", "Card", "February", "29,", "2012"]]',
  '[["Termination", "Color", "Test", "No", "Rate", "Currency", "Notes"]]',
]
lines = File.readlines('/path/to/file').reject { |line| rejected.include? line }
于 2012-11-29T09:55:52.803 に答える