問題タブ [ncbi]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ftp - NCBI の FTP サーバーのホームページに接続するときに rsync が機能しないのはなぜですか?
私は現在、職場でいくつかのコードを更新しようとしています。以前、NCBI の FTP Web サイト ( ftp://ftp.ncbi.nlm.nih.gov/ )でユーザーのパス選択を記録する最新バージョンの Python を使用してスクリプトを作成しました。ログは、更新されたファイルでファイル システムを更新するために使用されました (NCBI はファイルを毎週更新していると思います)。基本的にホイールを作り直しました。今rsyncを使いたいのですが、欲しいものが手に入らないようです...
上記のスクリプトは NCBI の Web サイトにアクセスし、ディレクトリのダウンロードを開始します。代わりに、NCBI ホーム ディレクトリ内のフォルダのリストをシェルに出力し、何もコピーせずに終了します。
出力は次のようになります。
私が使うたびに
(基本的に、NCBI の FTP ホームページ内に任意のディレクトリを含めると) すべて正常に動作するようです。
ここで何をすべきですか?問題/解決策は何ですか?
r - rentrez でコード配列を取得する際にタンパク質 ID を保持する方法
多数のタンパク質 ID があり、対応するコーディング シーケンス (CDS) を取得する必要があります。CDS を取得できましたが、各シーケンスの名前が XP* から XM* に変わり、各シーケンスの XP* ヘッダーを保持する必要があります。
基本的には次のようになります。
出力は次のようになります。
ヌクレオチド ID (XM_012514791.1) の代わりにタンパク質 ID (XP_012370245) を保持する方法はありますか? 何かのようなもの:
私は BioMart R パッケージ (biomaRt) でこれを行いましたが、rentrez ではもっと難しいようです。
どんな提案でも大歓迎です、ありがとう!