R
米国国勢調査データの操作を容易にするパッケージがいくつかあります。私が最も頻繁に使用するのはtigris
、(空間データの読み込み用) とacs
(表形式データの読み込み用) の 2 つです。
R
しかし、私が常に直面している問題の 1 つは、コンソールを離れずに Place 内のすべてのトラクト (またはブロック グループ、郵便番号など) を特定するための効率的で信頼できる方法を見つけられないことです。
たとえば、シアトルの国勢調査区画データを処理したい場合はtigris::tracts
、ワシントン州キング郡の空間データをダウンロードすることから始めます。
library(tigris)
tr <- tigris::tracts(state = "WA", county = "King")
しかし残念ながら、このデータをサブセット化してシアトルの地区だけを含める明確な方法はありません。
glimpse(tr)
Observations: 398
Variables: 12
$ STATEFP (chr) "53", "53", "53", "53", "53", "53", "53", ...
$ COUNTYFP (chr) "033", "033", "033", "033", "033", "033", ...
$ TRACTCE (chr) "003800", "021500", "032704", "026200", "0...
$ GEOID (chr) "53033003800", "53033021500", "53033032704...
$ NAME (chr) "38", "215", "327.04", "262", "327.03", "3...
$ NAMELSAD (chr) "Census Tract 38", "Census Tract 215", "Ce...
$ MTFCC (chr) "G5020", "G5020", "G5020", "G5020", "G5020...
$ FUNCSTAT (chr) "S", "S", "S", "S", "S", "S", "S", "S", "S...
$ ALAND (dbl) 624606, 3485578, 17160645, 15242622, 10319...
$ AWATER (dbl) 0, 412526, 447367, 526886, 175464, 0, 4360...
$ INTPTLAT (chr) "+47.6794093", "+47.7643848", "+47.4940877...
$ INTPTLON (chr) "-122.2955292", "-122.2737863", "-121.7717...
同様に、このacs
パッケージでは、関数を使用して国勢調査データのサブセットを作成できますgeo.make
が、私の例では、シアトルのすべての地区の地区 GEOID のリストをまだ持っていない場合、これは役に立ちません。
記録のために、私はこの情報を他の場所で決定できることを認識しています. Census.gov の FAQ のこのページでは、特定の国勢調査場所のすべての地区を特定する方法について明確な指示が提供されています。しかし、これは多くの国勢調査関連の分析において重要なステップであることを考えると、コンソールからR
簡単に実行できる方法があれば最高です。
前もって感謝します。
編集
この質問は空間データを扱っていますが、非空間的な解決策を見つけることに最も興味があります。たとえば、Census API にクエリを実行し、目的の GEOID のベクトルを返すソリューションを、空間分析ツール (例: rgeos::intersects
) を使用してベクトルを作成するソリューションに返します。なんで?空間的なアプローチは、このプロセスで単純にエラーが発生しやすく、これは私たちが話している既知の情報であり、空間的に推測する必要があるものではないためです。