問題タブ [reproducible-research]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
34 参照

r - ツールキット ドキュメントの docker: `docker export` にすべてのレイヤーが含まれていませんか?

分析の再現性を目的として分析環境を適切に文書化する他の手段をあきらめた後、R個々の分析をdockerコンテナーにラップすることに着手しました。これが私がすることです:

  1. プロジェクトrstudioから最新のコンテナーをプルします。rocker

    /li>
  2. プロジェクト固有のコピーを作成する

    /li>
  3. コンテナーを起動します。

    /li>
  4. R( Studio)-ベースのプロジェクト分析 ... sudo apt-get cleanandで終了sudo rm -rf /tmp/*

  5. Docker イメージをエクスポートします。

    /li>

関連するすべてのコンテナー/イメージをローカル レジストリから削除した後、次のようにパッケージ化されたプロジェクトの再訪をエミュレートしようとします。

  1. コンテナーをインポートします。

    /li>
  2. (試してみてください) 元のコンテナと同じようにコンテナを起動します。

    docker run -d -p 8787:8787 -e ROOT=TRUE rstudio_project.2018.2

次に、次のエラーに直面しています。

私は何を間違っていますか?デフォルトで何を開始するかについて、コンテナーはどこで (何を) 情報を失いましたか?

0 投票する
1 に答える
1224 参照

r - rmarkdown htmlドキュメントとデータを共有するための好ましい方法は?

R での分析からのコードを共有するために、rmarkdown html ドキュメントを作成しました。データも含めたいのですが、(受信者にとって) データを提供する最も便利な方法がわかりません。次のように、CSV を URI データ スキームとして埋め込むことができます。

または、未加工から派手なものまでの範囲の HTML テーブルを提供します。

他のオプションもあると確信しています。データセットの次元が datasets::iris と似ていると仮定すると、次のようなデータセットを共有するにはどうすればよいですか?

-ほとんどのプラットフォーム/ソフトウェアからアクセス可能です
-R に簡単に読み込むことができます -
コードを含む rmarkdown ドキュメント、つまり共有する単一のファイルでパッケージ化できます
-最小のファイル サイズです

データセットの次元が 100 倍大きい場合はどうなりますか?

0 投票する
7 に答える
22922 参照

python - tf.set_random_seed を使用した Tensorflow での再現可能な結果

N セットの独立した乱数を生成しようとしています。10個の乱数の3セットの問題を示す簡単なコードがあります。tf.set_random_seedを使用してシードを設定しても、異なる実行の結果は似ていないことに気付きました。ヘルプやコメントは大歓迎です。

これはコードの出力です:

私は何かが欲しい

更新 1:実際、シード初期化子を for ループ内に配置した理由は、それらを別の方法で設定したいからです (たとえば、別の MCMC 実行の場合と考えてください)。これは仕事をする私のコードですが、効率的かどうかはわかりません。基本的に、0 から 2^32-1 の間でいくつかのランダム シードを生成し、実行ごとにシードを変更します。メモリ/RAMの効率を高めるためのヘルプやコメントは大歓迎です。

0 投票する
1 に答える
144 参照

python-3.x - Keras を使用した機械学習プロジェクトのランダム性の一般的な原因は何ですか?

再現性は重要です。私が現在取り組んでいるクローズドソースの機械学習プロジェクトでは、それを達成するのは困難です。注目すべきパーツは?

0 投票する
2 に答える
4733 参照

r - R の colorBin() リーフレットが期待どおりに機能しない

その中にdata.frame2 行の があります。colorBinの関数を使用して、このデータを色でマッピングしようとしていますleaflet

都市には個別のビンがありますが、カラービンのある画像

マップ上で間違った色を取得し続けます。シェイプ ファイルに問題はありません。米国国勢調査からダウンロードしましたが、ビンが正しくカラー マッピングされていない理由がわかりません。

dsch_count_by_city と dsch_count_shp をファイルとしてアップロードする必要がある場合は、それを試すことができます

0 投票する
1 に答える
775 参照

r - Knitr::kable() で適応列名を設定する

以下をご検討ください。Rマークダウンで再現可能なドキュメントを書き始め、レポートの出力が必要です。私は複数で作業しており、それらの列名はあまり有益でなく、きれいでもないので、 で引数data.frameを利用したいと思います。col.namesknitr::kable()


問題:data.frameはかなり大きく、レポート全体で特定の列のみを表示したいので、選択した列に応じて新しい列名が自動的に表示されるようにしたいと考えています。

次の例のように、これを手動で行うことができます。

しかし、これを減らしてdata.frame特定の列のみを表示する場合は、エラー メッセージが表示されないように手動で再度設定する必要があります (ここでは、もう必要のない をcol.names削除します)。col.names


質問:これを克服する方法はありますか?たとえば、switchそれを一度だけ使用して指定する"Sepal.Length" = "Sepal length"などです。dplyr::mutate()これは、たとえば、新しく追加された列名をそのまま保持するか、この列が (まだ) 存在しないたびにエラーをスローすることなくドキュメントの先頭に指定することによって、作成する新しい列も考慮する必要があります。.