1

私は Java の初心者で、GenBank テキスト ファイルを FASTA 形式に変換できるプログラムを構築したいと考えています。基本的に 2 つのテキスト ボックスがあります。1 つは GenBank 形式のファイルをアップロードする場所、もう 1 つは変換された FASTA 形式のファイルを表示する場所です。

これは GenBank 形式のファイルです。

LOCUS       AB000263                 368 bp    mRNA    linear   PRI 05-FEB-1999
DEFINITION  Homo sapiens mRNA for prepro cortistatin like peptide, complete
            cds.
ACCESSION   AB000263
ORIGIN      
        1 acaagatgcc attgtccccc ggcctcctgc tgctgctgct ctccggggcc acggccaccg
       61 ctgccctgcc cctggagggt ggccccaccg gccgagacag cgagcatatg caggaagcgg
      121 caggaataag gaaaagcagc ctcctgactt tcctcgcttg gtggtttgag tggacctccc
      181 aggccagtgc cgggcccctc ataggagagg aagctcggga ggtggccagg cggcaggaag
      241 gcgcaccccc ccagcaatcc gcgcgccggg acagaatgcc ctgcaggaac ttcttctgga
      301 agaccttctc ctcctgcaaa taaaacctca cccatgaatg ctcacgcaag tttaattaca
      361 gacctgaa
//

対応する FASTA 形式のファイルは次のとおりです。

>AB000263 |acc=AB000263|descr=Homo sapiens mRNA for prepro cortistatin like peptide, complete cds.|len=368
ACAAGATGCCATTGTCCCCCGGCCTCCTGCTGCTGCTGCTCTCCGGGGCCACGGCCACCGCTGCCCTGCC
CCTGGAGGGTGGCCCCACCGGCCGAGACAGCGAGCATATGCAGGAAGCGGCAGGAATAAGGAAAAGCAGC
CTCCTGACTTTCCTCGCTTGGTGGTTTGAGTGGACCTCCCAGGCCAGTGCCGGGCCCCTCATAGGAGAGG
AAGCTCGGGAGGTGGCCAGGCGGCAGGAAGGCGCACCCCCCCAGCAATCCGCGCGCCGGGACAGAATGCC
CTGCAGGAACTTCTTCTGGAAGACCTTCTCCTCCTGCAAATAAAACCTCACCCATGAATGCTCACGCAAG
TTTAATTACAGACCTGAA

GenBank ファイルをトリミングし、クリックしたボタンを使用して 2 番目のテキスト ボックスに表示する方法やコードに関するアドバイスを手伝ってくれる人はいますか。

Netbeans 6.9 を使用しています。

4

1 に答える 1

4

私は使用していませんが、BioJava プロジェクトには、複数のシーケンスを含む可能性のある GenBankファイルを読み取るためのコードが含まれています。表示については、How Do I print A Sequence in Fasta Format を参照してください。

于 2012-09-06T17:22:04.110 に答える