パンダでファジーマッチングを使用して重複行を(効率的に)検出する方法
row_i を String() に変換し、それを他のすべてのものと比較する巨大な for ループなしで、1 つの列と他のすべての列の重複を見つける方法は?
パンダでファジーマッチングを使用して重複行を(効率的に)検出する方法
row_i を String() に変換し、それを他のすべてのものと比較する巨大な for ループなしで、1 つの列と他のすべての列の重複を見つける方法は?
パンダ固有ではありませんが、python エコシステム内では、重複排除 python ライブラリーはあなたが望むことをしているように見えます。特に、行の各列を個別に比較してから、情報を組み合わせて一致の単一の確率スコアにすることができます。