3

Kaggle から入手できる Titanic データセットを使用しています。私はそれをデータフレームに持っていて、「性別」列の大文字と小文字を小文字に変更したいと考えています。次のコードを使用しています

import pandas as pd

df = pd.read_csv('titanic.csv')
print dfFull['sex'].unique()
df.sex.str.lower()

#check if it worked
print df['sex'].unique()

また、しようとしています

df['sex'].str.lower()

しかし、実行するdf['sex'].unique()と、3 つの一意の値が得られます[male, female, Female]

私のコードが文字列の大文字と小文字を区別せず、データフレームに保存し[male, female]てメソッドから抜け出さないのはなぜ.uniqueですか?

4

1 に答える 1

9

str.lower()既存の列を変更しません。小文字の変換が適用された新しいシリーズを返すだけです。元の列を上書きする場合は、結果を元の列に割り当てる必要があります。

df['sex'] = df.sex.str.lower()
于 2014-10-20T19:37:02.970 に答える