行に余分な末尾の区切り文字があるcsv(コンマ区切り)ファイルは、混乱するようpandas.read_csv
です。(データファイルは[1]です)
余分な区切り文字は、余分な列があるかのように扱われます。したがって、ヘッダーに必要な列より1つ多い列があります。次にpandas.read_csv
、最初の列を行ラベルとして使用します。全体的な効果として、列とヘッダーが整列しなくなります。最初の列は行ラベルになり、2番目の列は最初のヘッダーで名前が付けられます。
かなり迷惑です。pandas.read_csv
正しいことをするように伝える方法はありますか?見つかりませんでした。
素晴らしい本、ところで。
[1]: Python forDataAnalysisの本の第9章からの2012FEC選挙データベース