1

Excel ワークブックの多くのワークシートで、データを "きれいなテーブル" として取得することがよくあります。「かなり」とは、すべてのワークシートの上部と下部に説明テキストがあること、ヘッダーにセルが結合されていること、ヘッダーと最初のデータ行の間に空白行があること、データ列の間に空白列があることなどを意味します.

これは、ある犯罪者の一部のスクリーン グラブです。

ここで手作業を減らすためのベストプラクティスはありますか?

1 つの方法は、これらのテーブルをすべて Excel で修正することです。もう 1 つの方法は、「そのまま」タブ区切りの txt に保存し、データ行を手動で選択してインポートし、空白の列を削除して、ヘッダー情報を手動で入力することです。私は後者を行う傾向がありますが、これでもかなり手作業です。

プロは何をしているの?こうやってみると、カット&ペーストを知らないヤツみたい。

FWIW、私はほとんどの場合に Python、Stata、および R を使用しますが、このプロセスを簡素化するツールはすべて受け入れます。ありがとう!

4

1 に答える 1

2

正直なところ、データのクリーニングのプロセスで使用する自動化の量は、それを実行する必要がある回数によって異なります。私にとっては、マクロを介してExcelのファイルを変更すると思います。

ファイルが(特定のタスクに対して)常に同じ形式である場合は、ファイルをクリーンアップするために実行している手順のマクロを記録して、個人のブックに保存するだけです。

それらがわずかに異なるが、テーマにバリエーションがある場合は、記録されたマルコを変更できます(理想的には、入力ファイルに応じて異なるパラメーターを受け入れるような関数に因数分解しDeleteTopRowsますDeleteEmptyColumns

Excel VBAは、この種の仕事をするのに最も簡単な場所だと思います。Excelアプリは、多くの組み込み関数を支援できるからです。たとえば、上記のシートでRange("10:11").Deleteそれらを削除します。

于 2012-11-16T01:48:33.087 に答える