を使用すると、引用符をエスケープしたデータフレームを作成できませんread_csv
。
(注:Rread.csv
は期待どおりに機能します。)
私のコード:
import pandas as pd
pd.read_csv('data.csv')
#error!
CParserError: Error tokenizing data. C error: Expected 2 fields in line 4, saw 3
data.csv
SEARCH_TERM,ACTUAL_URL
"bra tv bord","http://www.ikea.com/se/sv/catalog/categories/departments/living_room/10475/?se%7cps%7cnonbranded%7cvardagsrum%7cgoogle%7ctv_bord"
"tv på hjul","http://www.ikea.com/se/sv/catalog/categories/departments/living_room/10475/?se%7cps%7cnonbranded%7cvardagsrum%7cgoogle%7ctv_bord"
"SLAGBORD, \"Bergslagen\", IKEA:s 1700-tals serie","http://www.ikea.com/se/sv/catalog/categories/departments/living_room/10475/?se%7cps%7cnonbranded%7cvardagsrum%7cgoogle%7ctv_bord"
このcsvを読み取って、このエラーを回避するにはどうすればよいですか?
私の推測では、パンダは3行目のあいまいさやトリップを処理できない正規表現を使用していると思います。具体的には、次のようになります\"Bergslagen\"
。