私は仕事で調査データを扱うことがよくあります。このデータは、データ分析用ではなく、読みやすさのために設計された、ひどくフォーマットされた Excel ファイルになっています。R のデータをクリーンアップし、変数と観測のデータフレーム形式に変換する方法を探しています。
Rでのデータクリーニングに関するチュートリアルがたくさんあることは知っていますが、私の経験から、それらはすでに機械可読形式のデータを扱っているため、これに関する助けがあれば幸いです!
これは、この形状を持つ未加工の調査のダミーの例です。
Are you male or female?
Variable1 Variable2 Variable3 Variable4
Male n% n% n% n%
Female n% n% n% n%
How old are you?
Variable1 Variable2 Variable3 Variable4
18-34 n% n% n% n%
35+ n% n% n% n%
空白スペースは空のセル/行であり、各調査の質問全体が列 A にあり、対応するデータ テーブルの数行上にあり、すべての質問/データ テーブルが 1 つのワークシートにあります。
Rコードでこれに変換する方法はありますか?
Question Response Variable1 Variable2 Variable3 Variable4
Are you male or female? Male n% n% n% n%
Are you male or female? Female n% n% n% n%
How old are you? 18-34 n% n% n% n%
How old are you? 35+ n% n% n% n%
現時点では、いくつかの VBA コードを使用してこれを Excel で実行し、さらに分析/視覚化するために R を読み込んでいますが、Excel フェーズをスキップして R に直接進むことができれば幸いです。
ありがとう!