問題タブ [reproducible-research]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - ツールキット ドキュメントの docker: `docker export` にすべてのレイヤーが含まれていませんか?
分析の再現性を目的として分析環境を適切に文書化する他の手段をあきらめた後、R
個々の分析をdocker
コンテナーにラップすることに着手しました。これが私がすることです:
- /li>
プロジェクト固有のコピーを作成する
/li>コンテナーを起動します。
/li>R
(Studio
)-ベースのプロジェクト分析 ...sudo apt-get clean
andで終了sudo rm -rf /tmp/*
Docker イメージをエクスポートします。
/li>
関連するすべてのコンテナー/イメージをローカル レジストリから削除した後、次のようにパッケージ化されたプロジェクトの再訪をエミュレートしようとします。
コンテナーをインポートします。
/li>(試してみてください) 元のコンテナと同じようにコンテナを起動します。
docker run -d -p 8787:8787 -e ROOT=TRUE rstudio_project.2018.2
次に、次のエラーに直面しています。
私は何を間違っていますか?デフォルトで何を開始するかについて、コンテナーはどこで (何を) 情報を失いましたか?
r - rmarkdown htmlドキュメントとデータを共有するための好ましい方法は?
R での分析からのコードを共有するために、rmarkdown html ドキュメントを作成しました。データも含めたいのですが、(受信者にとって) データを提供する最も便利な方法がわかりません。次のように、CSV を URI データ スキームとして埋め込むことができます。
または、未加工から派手なものまでの範囲の HTML テーブルを提供します。
他のオプションもあると確信しています。データセットの次元が datasets::iris と似ていると仮定すると、次のようなデータセットを共有するにはどうすればよいですか?
-ほとんどのプラットフォーム/ソフトウェアからアクセス可能です
-R に簡単に読み込むことができます -
コードを含む rmarkdown ドキュメント、つまり共有する単一のファイルでパッケージ化できます
-最小のファイル サイズです
データセットの次元が 100 倍大きい場合はどうなりますか?
python - tf.set_random_seed を使用した Tensorflow での再現可能な結果
N セットの独立した乱数を生成しようとしています。10個の乱数の3セットの問題を示す簡単なコードがあります。tf.set_random_seed
を使用してシードを設定しても、異なる実行の結果は似ていないことに気付きました。ヘルプやコメントは大歓迎です。
これはコードの出力です:
私は何かが欲しい
更新 1:実際、シード初期化子を for ループ内に配置した理由は、それらを別の方法で設定したいからです (たとえば、別の MCMC 実行の場合と考えてください)。これは仕事をする私のコードですが、効率的かどうかはわかりません。基本的に、0 から 2^32-1 の間でいくつかのランダム シードを生成し、実行ごとにシードを変更します。メモリ/RAMの効率を高めるためのヘルプやコメントは大歓迎です。
python-3.x - Keras を使用した機械学習プロジェクトのランダム性の一般的な原因は何ですか?
再現性は重要です。私が現在取り組んでいるクローズドソースの機械学習プロジェクトでは、それを達成するのは困難です。注目すべきパーツは?
r - Knitr::kable() で適応列名を設定する
以下をご検討ください。Rマークダウンで再現可能なドキュメントを書き始め、レポートの出力が必要です。私は複数で作業しており、それらの列名はあまり有益でなく、きれいでもないので、 で引数data.frame
を利用したいと思います。col.names
knitr::kable()
問題:data.frame
はかなり大きく、レポート全体で特定の列のみを表示したいので、選択した列に応じて新しい列名が自動的に表示されるようにしたいと考えています。
次の例のように、これを手動で行うことができます。
しかし、これを減らしてdata.frame
特定の列のみを表示する場合は、エラー メッセージが表示されないように手動で再度設定する必要があります (ここでは、もう必要のない をcol.names
削除します)。col.names
質問:これを克服する方法はありますか?たとえば、switch
それを一度だけ使用して指定する"Sepal.Length" = "Sepal length"
などです。dplyr::mutate()
これは、たとえば、新しく追加された列名をそのまま保持するか、この列が (まだ) 存在しないたびにエラーをスローすることなくドキュメントの先頭に指定することによって、作成する新しい列も考慮する必要があります。.