0

「AGTE」という文字列の2 つのグループABがあり、これらを比較して統計的に類似しているかどうかを確認する方法を見つけたいと考えています。最初のグループ A は実際の観測で、B は予測です。各グループには約 400 人がいます。

**A**
GTAATEGTTTEAAA
TTEAGE
...

**B**
AGTEAAAAGT
TAT
GGATEAATGGGTEAATG
....

また、実際にプレゼンテーションを目的として、これらを何らかの方法で視覚化できるようにしたいと考えています。どうすればそれができるようになるのか、何かアイデアはありますか?

4

1 に答える 1

1

文字列間のレーベンシュタイン距離を計算してから、これらの文字列間の距離をプロットすることをお勧めします。値が大きいほど、類似性が低い文字列を示します。

レーベンシュタイン距離の計算を自分で実装したくない場合は、ファイル交換に関するこれらの 投稿を確認してください。

于 2012-09-15T12:54:40.360 に答える