次のようなデータフレームがあります。
apple aple apply
apple 0 0 0
aple 0 0 0
apply 0 0 0
Apple -> aple などの文字列の距離を計算したい。最終結果は次のとおりです。
apple aple apply
apple 0 32 14
aple 32 0 30
apply 14 30 0
現在、これは私が使用しているコードです(ただし、大きなデータの場合は非常に遅いです):
columns = df.columns
for r in columns:
for c in columns:
m[r][c] = Simhash(r).distance(Simhash(c))
距離を効率的に計算するのを手伝ってくれる人はいますか?