0

私は仕事で調査データを扱うことがよくあります。このデータは、データ分析用ではなく、読みやすさのために設計された、ひどくフォーマットされた Excel ファイルになっています。R のデータをクリーンアップし、変数と観測のデータフレーム形式に変換する方法を探しています。

Rでのデータクリーニングに関するチュートリアルがたくさんあることは知っていますが、私の経験から、それらはすでに機械可読形式のデータを扱っているため、これに関する助けがあれば幸いです!

これは、この形状を持つ未加工の調査のダミーの例です。

Are you male or female?

           Variable1 Variable2 Variable3 Variable4
Male       n%        n%        n%        n%
Female     n%        n%        n%        n%


How old are you?

           Variable1 Variable2 Variable3 Variable4
18-34      n%        n%        n%        n%
35+        n%        n%        n%        n%

空白スペースは空のセル/行であり、各調査の質問全体が列 A にあり、対応するデータ テーブルの数行上にあり、すべての質問/データ テーブルが 1 つのワークシートにあります。

Rコードでこれに変換する方法はありますか?

Question                Response Variable1 Variable2 Variable3 Variable4
Are you male or female? Male     n%        n%        n%        n%
Are you male or female? Female   n%        n%        n%        n%
How old are you?        18-34    n%        n%        n%        n%
How old are you?        35+      n%        n%        n%        n%

現時点では、いくつかの VBA コードを使用してこれを Excel で実行し、さらに分析/視覚化するために R を読み込んでいますが、Excel フェーズをスキップして R に直接進むことができれば幸いです。

ありがとう!

4

1 に答える 1