6

する必要がある:

  1. http://api.crunchbase.com/v/1/companies.jsによって提供されるすべての会社名の解析済みファイルをダウンロードします

  2. 構文「 http://api.crunchbase.com/v/1/company/permalink.js」を使用して、各会社名を使用してクエリを実行し、各会社の情報(Founded_year、資金提供者の会社名など)の解析済みファイルをダウンロードします。

このデータをスプレッドシートまたはその他の形式に解析して、分析のためにRにインポートしたいと思います。

このデータをRにインポートするのに最適な形式は何ですか?データをダウンロードしてテーブルのような構造に整理するにはどうすればよいですか?(例:行=会社、列= Funded_yearなどのプロファイル情報)(Rで分析することを最終目標とします)

4

1 に答える 1

9
library(RJSONIO)
library(RCurl)

# grab the data
raw_data <- getURL("http://api.crunchbase.com/v/1/companies.js")
# Then covert from JSON into a list in R
data <- fromJSON(raw_data)
length(data)
[1] 101782
# We can coerce this to a data.frame
 final_data <- do.call(rbind, data)
 # Then write it to a flat csv file
 write.csv(final_data, "final_data.csv")


> head(final_data)
     name                permalink     category_code
[1,] "Wetpaint"          "wetpaint"    "web"        
[2,] "AdventNet"         "adventnet"   "enterprise" 
[3,] "Zoho"              "zoho"        "software"   
[4,] "Digg"              "digg"        "web"        
[5,] "Facebook"          "facebook"    "web"        
[6,] "Photobucket, Inc." "photobucket" "web"        
于 2012-10-22T04:10:08.493 に答える