問題タブ [ncbi]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
911 参照

ftp - NCBI の FTP サーバーのホームページに接続するときに rsync が機能しないのはなぜですか?

私は現在、職場でいくつかのコードを更新しようとしています。以前、NCBI の FTP Web サイト ( ftp://ftp.ncbi.nlm.nih.gov/ )でユーザーのパス選択を記録する最新バージョンの Python を使用してスクリプトを作成しました。ログは、更新されたファイルでファイル システムを更新するために使用されました (NCBI はファイルを毎週更新していると思います)。基本的にホイールを作り直しました。今rsyncを使いたいのですが、欲しいものが手に入らないようです...

上記のスクリプトは NCBI の Web サイトにアクセスし、ディレクトリのダウンロードを開始します。代わりに、NCBI ホーム ディレクトリ内のフォルダのリストをシェルに出力し、何もコピーせずに終了します。

出力は次のようになります。

私が使うたびに

(基本的に、NCBI の FTP ホームページ内に任意のディレクトリを含めると) すべて正常に動作するようです。

ここで何をすべきですか?問題/解決策は何ですか?

0 投票する
1 に答える
122 参照

r - rentrez でコード配列を取得する際にタンパク質 ID を保持する方法

多数のタンパク質 ID があり、対応するコーディング シーケンス (CDS) を取得する必要があります。CDS を取得できましたが、各シーケンスの名前が XP* から XM* に変わり、各シーケンスの XP* ヘッダーを保持する必要があります。

基本的には次のようになります。

出力は次のようになります。

ヌクレオチド ID (XM_012514791.1) の代わりにタンパク質 ID (XP_012370245) を保持する方法はありますか? 何かのようなもの:

私は BioMart R パッケージ (biomaRt) でこれを行いましたが、rentrez ではもっと難しいようです。

どんな提案でも大歓迎です、ありがとう!