“protein-database”の関連問題_Stack Overflow日本語サイト

0 投票する

2 に答える

324 参照

r - 引き揃え文字位置

ペアワイズアラインを使用して、次の結果を取得します。

その後、次を使用できます。

パターンと件名の両方の完全な文字列シーケンスを取得します。しかし、オブジェクトから 448 と 1 を整数として取得するにはどうすればよいでしょうか。これらの数値を使用する必要がありますが、取得する方法がないようです。

r bioconductor protein-database

2012-06-03T18:16:33.057

0 投票する

1 に答える

661 参照

python - Biopython で PQR ファイルを解析する方法

Biopythonで PQRファイル (占有率と B 係数が原子電荷と半径に置き換えられた修正済みPDBファイル)を読み取れるようにしたいと考えています。

Biopython PDB パーサーは、Bfactor の読み取りに失敗します。これは、PDB 列のインデックス (PQR 形式では考慮されない) によって値を取得するためです。

標準的な PDB アトムレコードの例:

1.00 は占有率、48.46 は bfactor です。

そして PQR :

0.1010 は電荷で、1.8240 は半径です

"PDBConstructionException: Invalid or missing B factor"では、電荷/半径の値を回避して適切に解析するにはどうすればよいですか?

python parsing biopython protein-database

2012-11-13T15:29:10.403

0 投票する

1 に答える

816 参照

xml - Uniprot ダウンロードの情報を編集する方法 (txt または XML)

タンパク質グループの Uniprot ファイルをダウンロードしました (n>1000 であるため、これらのタンパク質を手動でチェックすることはできません)。完全なデータファイルは、フラットテキストファイルまたは XML ファイルとして提供されます。これらのファイルには多くの情報が含まれています (たとえば、ここを参照してください: http://www.uniprot.org/uniprot/?query=organism%3A%22homo+sapiens%22を参照してから、ダウンロードにアクセスしてください。 txt または xml ファイルの完全なデータについては、最初の 10 個を参照してください)。

彼らには必要のない情報がたくさんあるので、興味のある情報を選択する方法を見つける必要があります (できればデータマトリックスで)。すべてのエントリについて、これは次のとおりです。

一部のエントリにはすべての情報が含まれていない場合があり (膜貫通ドメインなど)、NA が入力される場合があります。一部のエントリには、同じ種類の複数回の情報が含まれる場合があります (膜貫通ドメインなど)。これらについては、すべてに名前を付ける必要があります。 (可能であれば、「,」または「;」または「|」で区切られた同じセル内)。

私はRに少し慣れていますが、それでここまでたどり着くことができませんでした（プログラミングスキルが不足している可能性があります）。私は XML エディターを調べました (これが最も簡単な解決策のように思われるため) が、何も機能させることができませんでした。途中で役立つものを見つけることができず、さまざまな手順を説明することができませんでした。また、R で XML ファイルを処理する方法が必要であることも知っていますが、そこにあるヘルプファイルも必要な場所に移動できませんでした。XMLQuire では、これまでにダウンロードできた唯一のもので、ファイルを見ることができましたが、何かをしたいときにクラッシュし続けます (ファイルを編集できる場所を見つけようとしているだけでも)。 )、ファイルが長すぎるか、別の問題がある可能性があります。

同様のことをした人を見つけたいと思っていますが、フリーウェアである限り、どんなに小さくても、どのプログラムを使用する必要があっても、すべての解決策を歓迎します。

また、不明な点がある場合はお知らせください。できる限り明確にするように努めています。そして、この件に関してそのようなブロンディになって申し訳ありません。

xml r protein-database

2013-01-11T06:17:09.913

0 投票する

0 に答える

170 参照