pandas ライブラリを使用して CSV データを読み込んでいます。私のデータでは、特定の列に文字列が含まれています。文字列"nan"
は、空の文字列と同様に可能な値です。pandasに「nan」を文字列として読み取らせることができましたが、空の値をNaNとして読み取らないようにする方法がわかりません。これがサンプルデータと出力です
One,Two,Three
a,1,one
b,2,two
,3,three
d,4,nan
e,5,five
nan,6,
g,7,seven
>>> pandas.read_csv('test.csv', na_values={'One': [], "Three": []})
One Two Three
0 a 1 one
1 b 2 two
2 NaN 3 three
3 d 4 nan
4 e 5 five
5 nan 6 NaN
6 g 7 seven
「nan」を文字列「nan」として正しく読み取りますが、空のセルは NaN として読み取ります。read_csvstr
に引数を渡そうとしましたが (を使用)、空のセルを NaN として読み取ります。converters
converters={'One': str})
読み取り後にfillnaで値を入力できることはわかっていますが、特定のCSV列の空のセルをNaNではなく空の文字列として読み取る必要があることをパンダに伝える方法は本当にありませんか?