18 列と 15K 行の df があります。
df.info() は最初の列に与えます:
'''
0 Behandelcode 17451 non-null object
''' 列 'Behandelcode' のすべての値を整数に変換すると、一部の文字列の末尾に文字が含まれているため失敗します。例: '''
(405, '33971'),
(406, '38154'),
(407, '033620A'),
(408, '33971'),
''' 文字列の最後に文字がある場合、文字列の長さは 7 です。
私はあまりにも長い間努力してきました。だからもう一度あなたの助けが必要です。
問題は、列 df2['Behandelcode'] を反復処理してすべての値を保持するにはどうすればよいかということですが、(たとえば) インデックス行 407 の 0336620A の A だけが削除されます。0336620 はそのままです。そして、これは文字で終わるすべての値に対してです。
私はこれを試しましたが、うまくいきませんでした....
'''
for i, value in enumerate(df2['Behandelcode']):
y = len(value)
if y == 7:
value[:-1]
else:
value = value
''' おそらく、len を使用するよりも安全でクリーンな python メソッドがあるでしょう。今のところ、まず最初に、この列をクリーニングして、type(int32) に設定できるようにします。あなたが私を助けることができれば、私は非常に感謝しています. こんにちはヤン
