次のデータフレームで複数の列を使用する場合、パンダの適用機能に問題があります
df = DataFrame ({'a' : np.random.randn(6),
'b' : ['foo', 'bar'] * 3,
'c' : np.random.randn(6)})
そして次の関数
def my_test(a, b):
return a % b
この関数を次のように適用しようとすると:
df['Value'] = df.apply(lambda row: my_test(row[a], row[c]), axis=1)
エラーメッセージが表示されます:
NameError: ("global name 'a' is not defined", u'occurred at index 0')
このメッセージがわかりません。名前を適切に定義しました。
この問題について何か助けていただければ幸いです
アップデート
ご協力いただきありがとうございます。私は確かにコードでいくつかの構文ミスを犯しました。インデックスは '' にする必要があります。ただし、次のようなより複雑な関数を使用しても同じ問題が発生します。
def my_test(a):
cum_diff = 0
for ix in df.index():
cum_diff = cum_diff + (a - df['a'][ix])
return cum_diff