私は約 2600 以上のゲノムを扱っており、さまざまなグループのゲノム、遺伝子、および遺伝子間の特徴を研究したいと考えています。代表者が非常に少ない分類群の場合、問題はありません。複数のゲノムを持つ分類学的グループの場合、各分類学的グループからほんの数人の代表者を得るために、どのような基準で同様のゲノムを削除する必要がありますか? 長さ、GC%、またはその他の機能を使用してゲノムを削除する必要があります。たとえば、2 つのゲノムの GC% 変動が 1% 未満の場合、それを削除する必要があります。そんな感じ。受け入れられる方法を提案し、その理由も親切に説明してください。
Example:
I have around 60 genomes of Mycobacterium sps
More than 20 are of M. tuberculosis alone which have
GC% range of 65.48 to 65.7 and
Length range of 4.27 to 4.41 MB
このような場合、類似のゲノムをスクリーニングして削除するにはどうすればよいですか?