問題タブ [google-genomics]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
google-cloud-storage - elasticluster、grid-engine-tools、および google cloud を使用して、ファイルのリストを単一の gzip ファイルに圧縮する方法
readthedocs.io ガイドに記載されていない詳細を解決するのに役立つので、事前にご協力いただきありがとうございます。必要なのは、複数のファイルを 1 つの gzip に圧縮することですが、このガイドでは、ファイルのリストを個々の gzip ファイルとして圧縮する方法のみを示しています。繰り返しますが、このセットアップに関するリソースとドキュメントはほとんどないため、助けていただければ幸いです。(追加情報がある場合は、ソースへのリンクを含めてください)
グリッド エンジンをセットアップした後、ガイドのサンプルを実行しました。
grid-computing-toolsを使用して複数のファイルを 1 つの gzip に結合するためのスクリプトがないと仮定するのは正しいですか?
Elasticluster Grid Engine セットアップで複数のファイルを 1 つの gzip に圧縮するソリューションはありますか?
grid-engine-tools を機能させるには、どのような変更を加えることができますか?
編集
クラスターを検討している理由は、ベンダーが注文ごとに 1 つの圧縮ファイルをダウンロードできるように、注文ごとにファイルを圧縮する複数の操作が同時に発生することが予想されるためです。
google-genomics - Google-Genomics のどの部分が、他の生物を研究している人々に開かれていますか?
Google Genomics 環境は、ヒトゲノムを扱っていない人にとって、どれだけ柔軟に対応できるのだろうか? 私はこの質問に明確に答えられる場所を見つけることができませんでした。深く入り込みすぎて、それが人間だけのものであることを知りたくないのです。誰か知っていますか?
google-cloud-storage - Google Genomics の仕事は終わらない
Google Genomics ReadGroupSets を使用してアラインメント データ (BAM ファイル) を保存していましたが、昨日までは驚くほど実行されていました...
昨日 (2016 年 8 月 29 日)、インポート ジョブ (メソッド: readgroupsets.import ) は「実行中」ステータスを開始しましたが、今まで「完了」またはエラー メッセージを達成していませんでした。
他の誰かが同じ問題を抱えていますか?
例: ジョブは 1 日間実行され、エラー メッセージは表示されません。
昨日も、Google Storage 内のオブジェクトから「公開リンク」を取得する際に一時的な問題が発生しましたが、現在は問題ありません。
編集: gcloud cli を使用して別のデータセットと別のクラウド プロジェクトを指定してインポート ジョブをトリガーしようとしましたが、ジョブはまだ「実行中」のままです。
edit2: Google Genomics を約 3 か月使用しており、400 以上のアラインメントを正常にインポートしています。今週だけ問題があります。
edit3:解決しました。すべてのジョブが正常に終了しました。
r - Rで「最新」バージョンのパッケージを有効にする方法(パッケージの上位バージョン)-機能/パッケージ「トラック」?
関数/パッケージ「tracks」を R で使用しようとしましたが、バージョンに互換性がありません。最初、この機能はパッケージ「ggbio」のものだと思っていましたが、これをインストールして実行しませんでした。
この関数/パッケージを使用して 2 つのグラフをマージし、同じスケール y になります。(同じスケール y で、他のグラフの上にあるグラフ)
有効にするために、試しました
うまくいきませんでした。私のコンピューターのバージョン R は 3.3.0 (Windows) および 3.2.3 (Linux-Ubuntu) です。
誰もこの関数/パッケージを使用したことがあり、私を助けることができますか?
google-cloud-dataflow - Google Pipeline VM インスタンスが無期限にハングするのはなぜですか?
Dockerflow を使用して、Google Cloud Platform で Google Pipelines API を介して並列タスクを実行しています。1,389 個の VM を並行して実行するシングル ステップ タスクを開始したところ、233 個の VM が明らかに何も実行されておらず、無期限にハングしていることがわかった。
シリアル コンソール出力のスポット チェックを行ったところ、VM で「コントローラー構成の取得に失敗しました」というエラーが発生することが繰り返し確認されました。
VM にログインしようとすると、「接続に失敗しました。ポート 22 で VM に接続できません」というエラーが表示されました。
VM インスタンスがハングする理由と、これらの問題の発生を回避するためにできることはあるのか疑問に思っています。
以下にシリアルコンソール出力のスニペットを含めました
google-bigquery - Google ゲノミクス bigQuery 差分テーブル データの説明
ゲノムの特定の領域のすべての呼び出しを読み取りたいと思います。遺伝子型に関係なく(参照ゲノムまたは代替のコード領域または非コード領域と等しい)。すべてのゲノムが配列決定されたと仮定します。次の表のうち、どれを見る必要がありますか?
私は Google BigQuery ゲノミクス データを使用しており、次のファイル拡張子の違いについて説明が必要です: *.genome_calls *.variants *.multisample_variants *.single_sample_genome_calls
どうもありがとう、エイラ