わかりましたので、Python (biopython、http://biopython.org/DIST/docs/tutorial/Tutorial.html) を使用して、FASTA ファイルからシーケンスの一部を抽出する必要があります。
各配列から最初の 10 塩基を取得し、それらを 1 つのファイルに入れ、FASTA 形式の配列情報を保持する必要があります。最悪の場合、配列情報を保持する方法がない場合は、塩基を使用することもできます. 次に例を示します。
>gi|2765658|emb|Z78533.1|CIZ78533 C.irapeanum 5.8S rRNA gene and ITS1 and ITS2 DNA
CGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTGATGAGACCGTGGAATAAACGATCGAGTG
AATCCGGAGGACCGGTGTACTCAGCTCACCGGGGGCATTGCTCCCGTGGTGACCCTGATTTGTTGTTGGG
>gi|2765658|emb|Z78533.1|CIZ78533 C.irapeanum 5.8S rRNA gene and ITS1 and ITS2 DNA
CGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTGATGAGACCGTGGAATAAACGATCGAGTG
AATCCGGAGGACCGGTGTACTCAGCTCACCGGGGGCATTGCTCCCGTGGTGACCCTGATTTGTTGTTGGG
>gi|2765658|emb|Z78533.1|CIZ78533 C.irapeanum 5.8S rRNA gene and ITS1 and ITS2 DNA
CGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTGATGAGACCGTGGAATAAACGATCGAGTG
AATCCGGAGGACCGGTGTACTCAGCTCACCGGGGGCATTGCTCCCGTGGTGACCCTGATTTGTTGTTGGG
最初の 10 塩基を取得する何らかの方法が必要です (そして、最後の 10 塩基に対して再度実行することを計画していました)。そのチュートリアルサイトはかなり徹底していますが、私はこれに慣れていません。これには触れていないので、可能かどうかさえわかりません. ご協力いただきありがとうございます。