DataFrame
100k 行と列があるとしますname
。この名前をできるだけ効率的に姓名に分割したいと思います。私の現在の方法は、
def splitName(name):
return pandas.Series(name.split()[0:2])
df[['first', 'last']] = df.apply(lambda x: splitName(x['name']), axis=1)
残念ながら、DataFrame.apply
本当に、本当に遅いです。この文字列操作を操作と同じくらい速くするためにできることはありnumpy
ますか?
ありがとう!