3

Rでデータ分析を行うためにMongoDBを使用しています。最初はMySQLを使用していましたが、これはうまく機能しましたが、この目的のためにMongoDBをテストしたかったのです。データセットには、現時点で約 2 億のエントリが含まれています。RODBC を使用すると、クエリ結果を data.frame にすばやく取得できます。sqlQuery(conn, "select * from td where prd = 'TY' and date = '2012-01-03'")

MongoDBには次のようなドキュメントがありますDocument{{_id=5537ca647a3ad42a84374f0a, prd=TY, time=1325661600043, px=130.6875, sz=11}}

Java では、1 日分のティック データ (約 100,000 エントリ) を取得し、Tick オブジェクトを作成して配列に追加できます。すべて 2 秒未満で完了します。

rmongodbを使用すると、以下は永遠にかかります。これを改善する方法はありますか?

query <- mongo.bson.from.list( list(product = "TY", date = as.POSIXct("2012-01-04")) )
res.cursor <- mongo.find(mongo, db.coll, query, limit = 100e3, options=mongo.find.exhaust)
resdf <- mongo.cursor.to.data.frame(res.cursor)

使用find.allも同様に遅いです。

4

0 に答える 0