9

単純なデータ フレームを R のディスクに保持し、セマンティック ロスを制限しながら保存するのに最適な形式は何ですか?

データセットをアーカイブしているのでお願いします。理想的な世界では、私のデータ形式には次の特性があります。

  1. 安定性 - ストレージ形式は R の将来のバージョンと互換性があります
  2. セマンティックな互換性 - ストレージ形式は、R の基本データ型のセマンティクスを理解します。たとえば、順序付けられた要素をラベル付きで適切な方法で保存できます。
  3. オープン スタンダード - 理想的には、フォーマットがオープン スタンダードであるため、他の統計パッケージ (現在または将来) がそれを理解できるようになります

私が最初に考えたのは、非常に安定している CSV を使用することでしたが、必要なセマンティックの豊富さが欠けています。一方、R の組み込み RData 形式は R のセマンティクスを完全にキャプチャしますが、リリース間で変更される可能性が高いようです (間違っていたら訂正してください)。

これら 3 つの必須条件のバランスを見つける別の形式はありますか?

4

1 に答える 1

4

でテキストファイルにダンプしますdput。そうすれば、R のオブジェクトのすべての構造を取得でき、R が存在しなくなった場合でもテキストベースの形式で、かなり簡単に解析できます。

おそらく (3) の「オープン スタンダード」テストには合格しません。

R は、その .RData 形式との下位互換性が非常に優れているため、最新の R によって書き込まれたファイルが古いファイルと同じでなくても、最新の R は古いファイルを読み取ります。ただし、R の存在を停止する必要がある場合、バイナリ形式のリバース エンジニアリングは、 からの出力を理解するよりも桁違いに困難ですdput

于 2013-03-09T12:18:59.030 に答える