5

私は「長い道のり」で目標を達成することができましたが、完全にR内にとどまることを望んでいます。国勢調査の人口統計データを郵便番号でデータベースのレコードに追加しようとしています。R には Census ベースのパッケージがいくつかあることは知っていますが、何かが欠けていない限り、これらのデータは郵便番号レベルでは存在しないようであり、既存のデータ フレームにマージするのも直感的ではありません。

要するに、R内でこれを行うことは可能ですか、それとも他の場所でデータを取得してRに読み込む最善の方法ですか?

どんな助けでも大歓迎です!

4

5 に答える 5

6

要するに、違います。国勢調査からzipへの翻訳は、通常、独自のソースから作成されます。

国勢調査の観点(プライバシー)から、郵便番号レベルで何かが見つかる可能性はほとんどありません。しかし、それはあなたが寒さの中に置かれているという意味ではありません。所有している郵便番号を使用して、MSA、muSA、またはCSAレベルの人口調査データを追加できます。必要なのは、MSA、muSA、またはCSA内の郵便番号のリストだけです。これにより、マージできます。あなたがまだそのようなリストを持っていないなら、かなり安いオンラインの束があります。

たとえば、カナダでは、FSAレベルでCRAから収入データを取得できます(A1A 1A1の形式の郵便番号の最初の3桁)。IRSが同様の情報を提供するかどうかはわかりませんが、米国国勢調査のデータについてもあまり詳しくありませんが、少なくともCSAレベルの情報を提供していると思います。

これらすべての頭字語に戸惑う場合:

  1. MSA: http: //en.wikipedia.org/wiki/Metropolitan_Statistical_Area
  2. CSA: http: //en.wikipedia.org/wiki/Combined_statistical_area
  3. muSA: http: //en.wikipedia.org/wiki/Micropolitan_Statistical_Area
于 2011-06-01T01:13:23.557 に答える
0

あなたの最善の策は、おそらく米国国勢調査局の TIGER/Line shapefilesを使用することです。州レベルの 2010 年の ZIP コード集計エリア シェープファイル (ZCTA5) があり、目的には十分である可能性があります。

国勢調査データ自体は、 American FactFinderで見つけることができます。たとえば、サブ郡レベル (都市/町) で人口推定値を取得できますが、郵便番号レベルで単純な人口推定値を取得することはできません。データセットの詳細はわかりませんが、1 つの解決策として、TIGER/Line データの一部としても利用できるリレーションシップ テーブルを使用するか、国勢調査データを含む場所名を空間的に結合することが必要になる場合があります (サブカウンティ シェープファイル)。 ZCTA5コードで。

メタデータからのメモ: 「これらの製品は、製品または出版物で自由に使用できますが、ソースとして米国国勢調査局に承認を与える必要があります。」

HTH

于 2011-06-01T03:12:01.503 に答える