r - R で列を効率的かつ選択的に結合する

Question

私は次のデータを持っています

countrycols = alljson[,c("country_gc_str","country_ipapi_str","country_tm_str")]

head(countrycols)
country_gc_str country_ipapi_str country_tm_str
1           <NA>                RU             RU
2           <NA>                CN             CN
3             US                US             US
4           <NA>                CD             CG
5           <NA>                DE             DE
6           <NA>              <NA>             NG

次の優先順位で国データが入力される新しい列 country_final_str を作成したいと思います。

country_gc_str
country_ipapi_str
country_tm_str

また、以下を使用して国の所得レベルを特徴付けています。

wbURL <- "http://api.worldbank.org/countries?per_page=304"
xmlAPI <- xmlParse(wbURL)
xmlDF <- xmlToDataFrame(xmlAPI)
xmlDF$iso2CodeChar <- as.character(xmlDF$iso2Code)
xmlDF$incomeLevelChar <- as.character(xmlDF$incomeLevel)
incomexml <- xmlDF[,c("iso2CodeChar","incomeLevelChar")]
incomexmltable <- as.data.table(incomexml)

次の for ループがありますが、100 万件を超えるレコードがあるため、永遠に時間がかかります。

  alljson$country_final_str <- alljson$country_gc_str
  alljson$income_level <- NA

  for (i in 1:length (alljson$country_final_str))
  {
    if (is.na(alljson$country_final_str [i]))
    {
      alljson$country_final_str [i] = alljson$country_ipapi_str [i];
    }
    if (is.na(alljson$country_final_str [i]))
    {
      alljson$country_final_str [i] = alljson$country_tm_str [i];
    }

    a<-incomexmltable[iso2CodeChar==alljson$country_final_str [i]]$incomeLevelChar

    if(length(a)==0)
    {
      alljson$income_level [i] <- NA
    } else {
      alljson$income_level [i] <- a
    }
  }

効率を改善する/ for ループを取り除くための考えはありますか? Windows を使用しているため、とを使用しapply/lapply/tapplyてコードを並列化する試みは失敗しました。doParalleldoSNOW

コラムの質問に対する正解については、@thelatemail による以下を参照してください。国の所得レベルについては、次のことを行いました。

allcountries <- unique(alljson$country_final_str)

alljson$country_income_str <- NA
sum(!is.na(countrycode(allcountries, "iso2c", "country.name")))
for (i in 1:length(allcountries))
{
  a<-incomexmltable[iso2CodeChar==allcountries[i]]$incomeLevelChar
  if(length(a)==0)
  {
    alljson$country_income_str[which(alljson$country_final_str==allcountries[i])] <- NA
  } else {
    alljson$country_income_str[which(alljson$country_final_str==allcountries[i])] <- a
  }

  alljson$country_income_str
}

r - R で列を効率的かつ選択的に結合する

1 に答える 1

Related

Reference