4

私は、研究を複数の詳細レベルで利用できるようにするというアイデアが好きです。つまり、何気なく好奇心旺盛な人には要約、興味のある人には全文、そして最後に同じ分野で働いている人や結果を再現しようとしている人のためのデータとコードです。実際のテキストとデータ/コードレベルの間に、別のレイヤーを挿入したいと思います。つまり、分析からの完全な回帰出力、診断プロット、探索的グラフのデータプロファイルなどを含む、一種の自動生成された付録を作成したいと思います。これらのプロット/回帰などが最終的な論文になったかどうかは関係ありません。

私が持っていたアイデアの1つは、.Rnwファイルを自動的に検査するスクリプトを作成することでした。

  • ロードされたすべてのデータセットのプロファイルを作成します(Hmisc(?)パッケージのようなもの)
  • すべての回帰を要約します-つまり、すべてのモデルに対してsummary(model)を実行します
  • すべてのプロットを提示します(最終バージョンで作成されたかどうかに関係なく)

アイデアは、紙の残りの部分のように書かれた正式な付録とは対照的に、この種の手間のかからないプッシュボタンのようなものを作ることです。私が探しているのは、比較的簡単な方法でRでこれを行う方法に関するいくつかのアイデアです。私の勘は、名前空間を調べて、何かが何であるかを理解してから、PDFにダンプする方法があるということです。

考え?このようなものはすでに存在しますか?

4

2 に答える 2

1

ジョン、これは面白そうに聞こえますが、データを提供し、記事がsweaveでフォーマットされている場合、この長いログファイルは冗長ではないでしょうか。

質問に戻りますが、調査したいパッケージの1つはzeligです。これは、「レプリケーションデータファイルの作成を自動化して、分析結果をレプリケートできるようにするためです(したがって、レプリケーションを満足させることができます)。標準)"。あなたが探しているものではありませんが、レプリケーションデータファイルの概念はあなたに他のいくつかのアイデアを与えるかもしれません。現在、複数のジャーナルがレプリケーションデータファイルを使用していることに注意してください。

于 2010-04-19T06:26:25.360 に答える
1

最近のJASAの記事http://hdl.handle.net/1902.1/12174でこれを試みました。紙全体を「作る」ことができるはずです。複製アーカイブについて注意すべき点の1つは、使用したRパッケージのバージョンをパッケージ化したことです。人々がパッケージを改善するにつれて、時々デフォルトを変更することが判明しました---それは私たちのビルドを壊すでしょう。おそらく将来的には、[round(x、digits =)が引数を失い、Rのバージョンから次のバージョンに位置するようになった方法を思い出してください-round(digits =、 x)警告なしに意味のない結果を提供しますか?]。

とにかく、これはそのような複雑なドキュメントでの私たちの最初の試みです。私はここhttp://hdl.handle.net/1902.1/13376にmakeを使用しない小さなバージョンを持っています。

于 2010-05-07T15:57:30.567 に答える