プロセスの一部では、文字列類似性アルゴリズムを適用する必要があります。
このプロセスの結果が保存され、SS_Datasetなどが生成されます。
このデータセットに基づいて、さらに決定を下す必要があります。
私の質問は次のとおりです。
SS_Datasetを生成するために1つ以上の文字列類似性アルゴリズムを適用する必要がありますか?
「距離」と「音のような」類似性を計算するアルゴリズム間の比較はありますか?
アルゴリズムの1つのファミリは、他のファミリよりも正確な結果を生成しますか?組み合わせにより、類似性についてより正確な結果が得られますか?
- 使用した実装をお勧めできますか?
私の実装には、次のライブラリのパッケージが含まれます