次のコードを使用してデータベースからシーケンスを抽出しようとしています:
use strict;
use Bio::SearchIO;
use Bio::DB::Fasta;
my ($file, $id, $start, $end) = ("secondround_merged_expanded.fasta","C7136661:0-107",1,10);
my $db = Bio::DB::Fasta->new($file);
my $seq = $db->seq($id, $start, $end);
print $seq,"\n";
C7136661:0-107
ファイルのように、抽出しようとしているシーケンスのヘッダーは:です。
>C7047455:0-100
TATAATGCGAATATCGACATTCATTTGAACTGTTAAATCGGTAACATAAGCAGCACACCTGGGCAGATAGTAAAGGCATATGATAATAAGCTGGGGGCTA
ヘッダーをより標準的なもの ( など) に切り替えると、コードは正常に機能しますtest
。私は、BioPerl が非標準の見出しを好まないと考えています。これを修正して、FASTA ファイルを再コーディングする必要がないようにする方法はありますか?