プロット時にいくつかの奇妙なプロパティを表示する大きな data.frame があります。私はそれについて Stackoverflow で質問したいと思います。そのためには、data.frame を SO に貼り付けることができる形式で書き出し、他の誰かが簡単に実行して元に戻すことができるようにしたいと思います。 data.frame オブジェクトをもう一度。これを達成する簡単な方法はありますか?また、非常に長い場合は、ここに直接貼り付けるのではなく、貼り付けビンを使用する必要がありますか?
4 に答える
質問に直接答えるには、データフレームに関する情報を使用summary()
または表示するのが最も簡単です。head()
実際のデータをSOの質問に貼り付けるのではなく、コミュニティが操作できるようにデータへのパブリックリンクを提供することをお勧めします。まだご覧になっていない方のために説明すると、box.netサービスはオンラインコラボレーションのための多くの空きスペースを提供します。
最後に、プロット時にデータが奇妙な動作を示している場合は、プロットを実行するために使用しているコードと、いくつかの例でプロット自体を提供してみませんか。
まず、ドリューのアイデアはとても良いです。
さらに、データを減らして「奇妙な」部分を分離する場合は、を使用しますdput()
。これは、他の人がロードできるようにするための最も簡単な方法です。ただし、最初にデータを妥当な量に減らす必要があります。
それ以外の場合は、HTTP経由でアクセスできる場所にCSVファイルとして投稿すると、。を使用して直接読み取ることができますread.csv
。非常に大きなデータセットを手伝ってくれるように人々に頼むのは無理ですが。
最後に、この質問に対する回答を見てください。Rでサンプルデータセットをロードするにはどうすればよいですか?
これは素晴らしい質問です。
これは、質問に付随するデータを提示しながら、より良い質問をするための推奨事項の形で、私の回答の試みです。私はおそらく以下のこれらの提案のすべてに違反しましたが、少なくとも将来参照する何かがあり、おそらく他の人にも役立つでしょう.
まず、質問をする人は誰でも答えを好むと思います
将来、現在の問題が属する一般的なクラスの問題を解決できるように、十分な抽象化を行います。と
目の前の問題を実際に解決するのに十分な実用的なガイダンス (通常、これは実際の R コードを意味します) を使用します。
繰り返しますが、質問の抽象化は (通常) 回答の抽象化につながります。これは、より有用な回答を意味するだけでなく、実際に受け入れ可能な回答を得る可能性を高めます。コミュニティがその正確なデータセットを以前に見たことはほとんどありません。 ; ここにいる誰かがパターンを認識する可能性ははるかに高いです。しかし、データが多すぎるとパターンが不明瞭になる可能性があります。
第二に、質問を適切に説明するために必要なデータの量は実際には重要ではありません。重要なのは、質問に答えようとしている人々がそのデータを R 環境に取り込むのにどれだけの時間がかかるかです。ベース R ディストリビューションで提供される 50,000 行のデータ セットがありますが、数回のキーストロークでデータを R に取り込むことができるため、問題ではありません。さらに、それらのデータ セットの 1 つを参照できれば、質問ウィンドウ内でわざわざカット アンド ペーストする必要はありません。対照的に、私は人々が私の質問を適切に理解できるように、SO ページから数行のデータでもこすり落とすことを強制しないようにしています (Dirk を除いて、彼は頭の中で計算を行います)。
第三に、絶対に必要な場合を除き、質問のデータ セットの幅全体 (すべての列) をカット アンド ペーストするのは面倒です。データが簡潔な問題の説明の代わりになることはめったにありません。OPが1〜2分かけて実際のデータセットをトリミングし、質問を説明するために実際に必要な以上のデータを提供しないようにすることをお勧めします。
第 4に、数式またはアルゴリズムによってデータを「提供」できる場合は、それを提供するだけです。たとえば、質問がランダム ウォークに関連する場合、データは必要ありません。「ランダム ウォーク」と言うだけで、ここにいるほぼ全員が短いコード行でデータを生成できます。
dump
データフレームがそれほど大きくない場合にうまく機能します。