read_csv
CSVファイルをPandasデータフレームに読み込むために使用しています。私のCSVファイルには、多数の小数/浮動小数点が含まれています。数値は、ヨーロッパの10進表記を使用してエンコードされます。
1.234.456,78
これは、「。」を意味します は千単位の区切り文字として使用され、「、」は小数点です。
パンダ0.8。read_csv
千の区切り文字を設定するための「千」と呼ばれる引数を提供します。小数点を提供するための追加の引数もありますか?いいえの場合、ヨーロッパ式の10進数を解析する最も効率的な方法は何ですか?
現在、私は文字列置換を使用していますが、これはパフォーマンスが大幅に低下すると考えています。私が使用しているコーディングは次のとおりです。
# Convert to float data type and change decimal point from ',' to '.'
f = lambda x: string.replace(x, u',', u'.')
df['MyColumn'] = df['MyColumn'].map(f)
どんな助けでも大歓迎です。