acs R パッケージの最適な使用方法についていくつか質問があります。よろしくお願いします。
郵便番号ごとにAPIから取得できるすべての国勢調査データを含むルックアップテーブルである包括的なデータフレームを構築したいと思います。現在、以下の例のように R コードを使用していくつかの個別のテーブルを検索しています。使用可能なすべてのテーブルを見つけて、列名が入力されたデータ テーブル データセットを自動的に構築するより良い方法はありますか? 私は acs.lookup 関数を認識していますが、すべてのテーブルをロードして、郵便番号のデータを取得したいと考えています。acs.lookup 出力からすべてのテーブルのリスト、または使用可能なテーブルの完全なリストを取得する方法はありますか?
また、できるだけ多くの変数の将来の予測データを取得したいと考えています。複数年 (2014 年、2013 年、2012 年、2011 年) を使用し、2014 年の acs14lite R パッケージを使用して、上記の方法を使用して見つけた予測を計算できると思います。これを行う前に、米国の国勢調査自体に、このACSデータか何か?
ユーザー指定の地域を作成する
すべての郵便番号を使用
zip_geo = geo.make(zip.code = "*")
レース データ フレームの作成
レースデータを取得する
race.data = acs.fetch(geography=zip_geo, table.number = "B03002", col.names = "pretty", endyear = 2013, span = 5)
人口統計のデータ フレームを作成する
zip_demographics = data.frame(region = as.character(geography(race.data)$zipcodetabulationarea), total_population = as.numeric(estimate(race.data[,1])))
zip_demographics$region = as.character(zip_demographics$region)
data.frame に変換します
race_df = data.frame(white_alone_not_hispanic = as.numeric(estimate(race.data[,3])), black_alone_not_hispanic = as.numeric(estimate(race.data[,4])), asian_alone_not_hispanic = as.numeric(estimate( race.data[,6])), hispanic_all_races = as.numeric(estimate(race.data[,12])))
zip_demographics$percent_white = (race_df$white_alone_not_hispanic / zip_demographics$total_population * 100) zip_demographics$percent_black = (race_df$black_alone_not_hispanic / zip_demographics$total_population * 100) zip_demographics$percent_asian = (race_df$asian_alone_not_hispanic / zip_demographics$total_population * 100) zip_demographics$percent_hispanic = ( race_df$hispanic_all_races / zip_demographics$total_population * 100)