次のデータをスクレイピングする Web スクレーパーがあります。
TESTDATA
DATA:DATA
Data £9500
Data £930
Data £500
Data £2250
Data £930
Data £500
Data £2250
DATATEST
DATA:DATA
Data £95001
Data £9302
Data £5003
Data £22504
Data £9305
Data £5006
Data £22507
実行中:print full_end
戻り値:
[u'TESTDATA', 'DATA:DATA', 'Data £9500', 'Data £930', 'Data £500', 'Data £2250', 'Data £930', 'Data £500', 'Data £2250', '\r', DATATEST', 'DATA:DATA', 'Data £95001', 'Data £9302', 'Data £5003', 'Data £22504', 'Data £9305', 'Data £5006', 'Data £22507']
実行中:print repr(full_end)
戻り値:
u"TESTDATA\nDATA:DATA\nData £9500\nData £930\nData £500\nData £2250\nData £930\nData £500\nData £2250\n\r\nDATATEST\nDATA:DATA\nData £95001\nData £9302\nData £5003\nData £22504\nData £9305\nData £5006\nData £22507"
実行中:print repr('\r\n'.join(full_end).strip())
戻り値:
u"TESTDATA\r\nDATA:DATA\r\nData £9500\r\nData £930\r\nData £500\r\nData £2250\r\nData £930\r\nData £500\r\nData £2250\r\n\r\r\nDATATEST\r\nDATA:DATA\r\nData £95001\r\nData £9302\r\nData £5003\r\nData £22504\r\nData £9305\r\nData £5006\r\nData £22507"
画像: http://i.imgur.com/Qe0TE5Y.png
次のスクリプトを使用して
with open('FULL_DATA.txt','r') as full_end_datafile:
full_end_datafile_read = full_end_datafile.read()
encoded_data = '\n'.join(full_end).encode("Latin-1")
if full_end_datafile_read == encoded_data:
encoded_data = ""
else:
with open('FULL_DATA.txt','w') as full_end_datafile:
full_end_datafile.write('\n'.join(full_end).encode("Latin-1"))
注: メモ帳でファイルを編集すると、各データセット/グループ間に 1 行が表示され、メモ帳 ++ では各データセット/グループ間に 2 行が表示されます
書き込みオプションと読み取りオプションを変更するrb
とwb
、次のようになります。
データが同じであると認識せず、ファイルを再保存します
誰でもこれを修正する方法を知っていますか?
前もって感謝します-Hyflex