私はタンパク質を表す ID コードを持っています。タンパク質関連の情報を扱っているInterProというサイトがあります。その Web サイトの URL には、その特定のコードが含まれています。その URL のコードを変更することで、任意のタンパク質に関する情報を取得できます。Web から直接情報を取得するためのスクリプトを perl で開発しました。次のコードを使用しました
my $uniprot= "P15700";
my $resp= '';
my $url= "http://wwwdev.ebi.ac.uk/interpro/ISearch?query=$uniprot+";
my $file = "$uniprot";
$resp = getstore( $url, $file );
exit;
}
この例では、P15700 はタンパク質の一意の ID であり、URL はhttp://wwwdev.ebi.ac.uk/interpro/ISearch?query=P15700+です。これで、html ページ全体が取得されます。しかし、「タンパク質ファミリーメンバーシップ」という見出しの下にあるそのページの特定の情報が必要です. この例のように、このリンクを開くと、タンパク質ファミリー メンバーシップの見出しの下に「Adenylate kinase」と書かれています。別の出力テキスト ファイルにその情報が必要なだけです。1 つの列には ID が表示され、もう 1 つの列にはタンパク質ファミリー メンバーシップの情報が表示されます。私は perl を初めて使用し、コンピューター サイエンスのバックグラウンドを持っていません。むしろ私は生物学者です。それで、上記のタスクがperlを使用して実行できるかどうかを知りたいです。はいの場合、どのように?誰かがこの問題を解決できるなら、私は感謝します。