パンダでこれを行う方法:
extract_text_features
複数の出力列を返す単一のテキスト列に関数があります。具体的には、この関数は 6 つの値を返します。
関数は機能しますが、出力が正しく割り当てられるような適切な戻り値の型 (pandas DataFrame/numpy array/Python リスト) がないようです。df.ix[: ,10:16] = df.textcol.map(extract_text_features)
df.iterrows()
だから私はこのように、との繰り返しに戻る必要があると思いますか?
更新: での反復df.iterrows()
は少なくとも 20 倍遅いため、降伏して関数を 6 つの異なる.map(lambda ...)
呼び出しに分割しました。
更新 2: この質問は、 v0.16 で使いやすさが改善されるか追加される前に、 v0.11.0 の頃に尋ねられました。したがって、質問と回答の多くはあまり関連性がありません。df.apply
df.assign()