国勢調査データをかなり非集計データ (例: 5 歳グループの年齢変数) からセグメント化し、集計に基づいて集計変数 (例: 郡ごとに 18 歳以上のすべての男性) を作成しようとしています。私の解決策はrowSumsです。たとえばcounty$MalesOver18 <- rowSums(county[,c(68:87)])
、vars 68-87の合計が18歳以上の男性に加算されます-正常に動作します。ただし、500 個の変数を使用すると、開始/終了列の順序を数えるのは効率的ではありません。
しかし、私の好みのソリューションである rowSums の列名 (例: rowSums(county[,c(H76007:H76025)]
H vars = フィールド名) を使用すると、次の 2 つのメッセージ エラーのいずれかが発生します。
列名を引用符で囲んで実行: Error in "H76007":"H76025" : NA/NaN argument
In addition: Warning messages:
1: In
[.data.frame (county, , c("H76007":"H76025")) :
NAs introduced by coercion
2: In
[.data.frame(county, , c("H76007":"H76025")) :
NAs introduced by coercion
引用符で囲まれていない列名で実行: Error in
[.data.frame(county, , c(H76007:H76025)) :
object 'H76007' not found
na.rm コマンドを使用して、変数を数値として設定しようとしましたが、それらはすでに整数ですが、すべて結果がありません。
ガイダンスはありますか?ありがとう。