perl - PERL を使用して .gtf から新しいテキストファイルに情報を抽出する

Question

以下の .gtf ファイルがあります。4 つの変数 (染色体、開始/停止コドン、転写 ID) のみを抽出する必要があります。

1       Cufflinks       transcript      11869   14412   1000    +       .      gene_id "CUFF.1"; transcript_id "CUFF.1.2"; FPKM "0.3750000000"; frac "0.000000"; conf_lo "0.375000"; conf_hi "0.375000"; cov "1.470346"; full_read_support "yes";
1       Cufflinks       transcript      11869   14412   444     +       .      gene_id "CUFF.1"; transcript_id "CUFF.1.3"; FPKM "0.1666666667"; frac "0.000000"; conf_lo "0.166667"; conf_hi "0.166667"; cov "0.653487"; full_read_support "yes";
2       Cufflinks       transcript      11869   14412   333     +       .      gene_id "CUFF.1"; transcript_id "CUFF.1.4"; FPKM "0.1250000000"; frac "0.000000"; conf_lo "0.125000"; conf_hi "0.125000"; cov "0.490115"; full_read_support "yes";**

私の質問は、スクリプトが選択したファイルで動作することをどのように認識しているのかということです。

使用しましたか:

(1)my $file = 'transcripts_selected.gtf'

(2) このスクリプトを使用して、分割されたデータを抽出することもできます。

say $data->{"chromosome_number"}->{"start_codon"}->{"stop_codon"}->{"transcript_id"};

またはすべき：

BioSeq->new(-chromosome_number, -start_codon...)方法は？

(3) 最後に、このスクリプトは BioperlHOWTO から取得したものです。

my $seq_in = Bio::SeqIO->new( -file   => "<$infile", -format => $infileformat,);
my $seq_out = Bio::SeqIO->new( -file   => ">$outfile", -format => $outfileformat,);
while (my $inseq = $seq_in->next_seq) {$seq_out->write_seq($inseq);

.gtf ファイルの名前をここに配置し、選択したデータを含む新しいファイルの名前を $outfile と置き換える必要がある変数 $infile/$outfile はどこにありますか?

score 1 · Accepted Answer

ファイル名を指定する最も簡単な方法は、次のように書くことです。

my $infile = shift;
my $outfile = shift;

HOWTO のコードブロックの上に、次のように入力します。

perl ScriptName transcripts_selected.gtf OutFileName

コマンドラインで

perl - PERL を使用して .gtf から新しいテキスト ファイルに情報を抽出する

1 に答える 1

Related

Reference

perl - PERL を使用して .gtf から新しいテキストファイルに情報を抽出する