問題タブ [reproducible-research]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - rmarkdown/knitr を使用して、すべてのコードを最後まで保持します
私は、knitr/rmarkdown を使用して、すべての出力をまとめて保持するドキュメントを生成できるようにしたいと考えていますが、コードは最後まで残します。脚注を使用して付録で)。これは可能ですか?
r - repmis::dropboxData を使用したコード チャンクは、ある Rstudio プロジェクトでは機能しますが、別のプロジェクトでは機能しません
github リポジトリに関連付けられた 2 つの R プロジェクトがあります。私はrepmis関数source_DropboxDataを使用してファイルをダウンロードし、次にdplyrでtbl_dfを使用しています
両方のプロジェクトのコードは次のとおりです。
プロジェクトの 1 つで、これにより RStudio がクラッシュします。他の場合はそうではありません。
動作するプロジェクトの sessionInfo():
クラッシュするプロジェクトの sessionInfo():
違いの原因は何ですか? また、さらに調査するにはどうすればよいですか?
アップデート
明らかに主な違いは、動作するバージョンが repmis_0.3.3 を使用し、バージョンが repmis_0.4 を使用しないことです。repmis を使用して自分自身をダウングレードする方法を見ていきます。
ダウングレードが機能していないようでした - 「インストールの終了ステータスがゼロ以外でした」
nb私はpackrat
両方のプロジェクトでも使用しています
- どちらのパッケージの外部でも repmis 0.4 を試してみましたが、動作します。ただし、plyr と dplyr はインストールされていません。
- プライヤーを取り付けた状態で動作します...
r - 再現性のためにスクリプトに必要なライブラリ/パッケージのリストを取得します
これは、コードの再現性に関する便宜上の問題です。さまざまなタイミングで (たとえば、マークダウン ドキュメントのさまざまなセクションで) さまざまなカスタム ライブラリが呼び出される長いコードになるか、または長いコードを受け取る可能性があります。不十分に構成されたドキュメントがあるとします。
これらすべてのインスタンスをコードから取得し、たとえばリストとして保存する機能はありますか?
次に、スクリプトを更新して、別のワークスペースで作業しているユーザーの参照として使用されるコメント行を含めることができます。
もちろん、スクリプトからすべてのライブラリ関数を見つけることは可能ですが、独自のスクリプトを構成するため、または作成が不十分な他のスクリプトを更新するために、これを自動化することをお勧めします。
random - 疑似乱数発生器とプラットフォーム依存性
疑似乱数ジェネレーターは決定論的であることを意図していることを知っています。つまり、同じシードが使用されると、同じシーケンスの出力が生成されます。実際には、これはすべて、同じプラットフォーム、つまり同じハードウェア、OS などを使用している場合にのみ当てはまります。
ただし、場合によっては、異なるプラットフォームで同じコードを実行すると、異なる答えが得られることがあります (ここで簡単に指摘したように: How to generate a repeatable random number sequence? )。
別の例として、この記事では、いくつかのニューロイメージング アプリケーションのコンテキストで、このような違いの原因を研究しています。
私の質問は、この現象について十分に文書化された一般的な説明があるかどうかです。他のポインタは大歓迎です。
言い換えれば、疑似乱数発生器の再現性が危険にさらされるのはどのような状況でしょうか? そして、これらの状況をどのように回避できますか (そして、クロスプラットフォームの再現性を真に保証することができますか?)
python - Knitr - Python エンジンのキャッシュ オプションが機能しない
yihui は、さまざまなエンジンにキャッシュ オプションを使用する例を示しています。
https://github.com/yihui/knitr-examples/blob/master/023-engine-python.Rmd
Pythonで動作させることができないようです。
以下の作品
しかし、これは機能しません
誰にもアイデアがありますか?
r - rstudio での git 情報の抽出
私は、RStudio と Rmarkdown で再現可能な研究を試みています。主な理由は、図をパワーポイントや単語に何度も貼り付けるのが面倒だからです。 ニヤニヤ
再現可能な調査で非常に重要だと思うことの 1 つは、レポートを作成した RMarkdown ドキュメントのバージョンを正確に記録することです。多くの場合、そのようなドキュメントは多くの改訂を経ており、さらに、リポジトリから他の複数のソース ファイルまたはデータを取得する場合があります。そのため、git commit SHA を挿入し、リポジトリがクリーンかダーティかを記録します。
しかし、RStudio は git について知っているにもかかわらず、この情報を API 呼び出しで利用できるようにはしていないようです。または、何か不足していますか?
手動で git にシェルアウトする以外に、どのようなオプションがありますか?
r - Knitr でチャンクをコピーする方法は?
ニットの達人、
背景: Knitr を使用して、多くのグラフが埋め込まれたレポートをレポートします。レポートの本文で適切なのは、コードではなくグラフだけです。
例えば:
この部分は問題なく動作します。
ただし、コードの重要な部分(主要な統計分析や主要なグラフの生成など)を表示する必要がありますが、補遺では.
これが次の質問につながります: スクリプトの初期部分から後の部分に Knitr チャンクをコピーする方法はありますか?
正確性を確保するために、付録リスト (表示) のコードは、レポートで実際に実行されたすべてのコードであることが理想的です。
例えば:
何か案は?これらのタイプのチャンクコピーをknitrで実行する方法はありますか?
r - スクリプトを使用して R に dput をロードする
data.frame
再現可能な例を作成するとき、次のように出力したいことがよくありますput()
。
ただし、データをロードしようとすると、ファイルを要求されます。
再現可能な例であるスクリプトを作成するために、簡単に を作成しdput
て再度ロードするにはどうすればよいですか? ファイルとして保存することは避け、全体をスクリプトとして実行するだけです。