1

XML ドキュメントに変換した PDF ドキュメントがあり (操作を少し簡単にするため)、ほとんどのデータを取り除き、行のペアを csv 形式に変更する必要があります。これが私のXMLにあるものです:

<text top="231" left="75" width="154" height="11" font="2">JGD0002250185412827</text>
<text top="231" left="288" width="122" height="11" font="2">CODE99876</text>
<text top="231" left="482" width="8" height="11" font="2">1</text>
<text top="231" left="555" width="57" height="11" font="2">IP65 5LK</text>
<text top="231" left="696" width="89" height="11" font="2">Malcolm Montgomery</text>
<text top="252" left="75" width="154" height="11" font="2">JGD0012564109019827</text>
<text top="252" left="288" width="122" height="11" font="2">CODE4674</text>
<text top="252" left="482" width="8" height="11" font="2">1</text>
<text top="252" left="551" width="65" height="11" font="2">CV98 3LN</text>
<text top="252" left="680" width="121" height="11" font="2">WILLIAM SHATNER</text>

そこから次のようなものを取得する必要があります。

"CODE99876","JGD0002250185412827","IP65 5LK"
"CODE4674","JGD0012564109019827","CV98 3LN"

私はそれが可能であると仮定していますが、これまでのところ運が悪いです (実際、私の出力は、怒っている子供がアルファベットのスパゲッティのバケツで町に行ったように見えます)。

4

2 に答える 2