4

パンダでファジーマッチングを使用して重複行を(効率的に)検出する方法

ここに画像の説明を入力

row_i を String() に変換し、それを他のすべてのものと比較する巨大な for ループなしで、1 つの列と他のすべての列の重複を見つける方法は?

4

3 に答える 3

5

パンダ固有ではありませんが、python エコシステム内では、重複排除 python ライブラリーはあなたが望むことをしているように見えます。特に、行の各列を個別に比較してから、情報を組み合わせて一致の単一の確率スコアにすることができます。

于 2016-09-18T02:52:09.593 に答える