非常に粗雑なデータセットが与えられました。1 つのデータセットから、各 X 変数のコード (4 桁のコード) と、各コードの意味を説明するテキスト ファイルが得られます。奇妙なことに、コードが何かを意味することも、範囲が同じことを意味することもあります。例えば:
X
2321
2322
2341
2520
2572
4000
4001
4002
4100
テキストファイルは次のとおりです。
2300-2372 = New York
2520 = Chicago
2572 = Denver
4000-4099 = Austin
4100-4200 = San Diego
何百行ものコードを作成せずに、指定された Stata ファイルを簡単にコーディングできる方法が必要でした。私は1000以上の分類と約100万の観測を持っているので.