2

データセット (主に時系列データ) をデータ サイエンティストのグループと共有して、データ内の統計的関係 (変数間など) を調べたいと考えています。ただし、機密保持上の理由から、元のデータセットを共有することはできません。そのため、私が知っているランダムな変換でデータを変換できるかどうか疑問に思っていましたが、受信者はそうしません。これは一般的な方法ですか?関連する R パッケージはありますか?

私は合成データセットの使用を検討しており、「synthpop」を見てきましたが、少し違うように見える課題があります。たとえば、元のファイルに似た架空の人物を必ずしもデータに含める必要はありません。むしろ、特定の変数に関連付けられた値が人間の閲覧者にとって不明確である (たとえば、数値であるが無意味である) ことを好みますが、統計分析を可能にします (たとえば、実際の値が不明確であるにもかかわらず、変数 'x' と ' y' は同じままです)。

これはおそらく非常に単純なプロセス (変数の名前を変更する、すべての変数に同じ変換を適用するなど) だと思いますが、私は数学者/統計学者ではないので、不適切な変換。

ありがとう!

4

0 に答える 0