次の入力があります。CSV区切りの文字列に解析したい。正規表現パターンを使用して SKU を取得できますが、正規表現解析は初めてなので、複雑なパターンはわかりません。誰かがこれで私を助けてくれたらいいのにと思います。
ありがとう!
charset="iso-8859-1"
BODY {
}
TD {
}
TH {
}
H1 {
}
TABLE,IMG,A {
}
**PO Number:** 35102
**Ship To:**
Georgie Clements
6902 Stonegate Drive
Odessa, TX 79765
432-363-8459
SKU
Product
Qty
JJ-Rug-Zebra-PK
Zebra Pink Rug
1
JJ-Zebra-PK-Twin-4
Zebra Pink 4 Piece Twin Comforter Set
1
JJ-TwinSheets-Zebra-PK
Zebra Pink 3 Piece Twin Sheet Set
1
JJ-Memo-Zebra-PK
Zebra Pink Memory Board
1
私はそれを次のようにフォーマットしたい:
PONumber, Shipping info, SKU, Product, Qty
'35102', '[ShipToAddress]', 'JJ-Rug-Zebra-PK', 'Zebra Pink Rug', '1'
'35102', '[ShipToAddress]', 'JJ-Zebra-PK-Twin-4', 'Zebra Pink 4 Piece Twin Comforter Set', '1'
'35102', '[ShipToAddress]', 'JJ-TwinSheets-Zebra-PK', 'Zebra Pink 3 Piece Twin Sheet Set', '1'
'35102', '[ShipToAddress]', 'JJ-Memo-Zebra-PK', 'Zebra Pink Memory Board', '1'
現在のコードは次のとおりです。
pattern = re.compile(r'(\b\w*JJ-\S*)')
pos = 0
while True:
match = pattern.search(msgStr, pos)
if not match:
break
a = match.start()
e = match.end()
print ' %2d : %2d = %s' % (a, e-1, msgStr[a:e])
pos = e