現在、あるデータベースから別のデータベースにデータを移行しています。
移行するデータは、製品のバージョンのレビューです。
レビューごとに多くのバージョンがあります。23Kの個別のレビューがあり、レビューがある60kのバージョンは、およそ3つのバージョンごとにレビューを共有することを意味します。
私のJavaアプリケーションでは、ホストデータベースに、レビューデータベースのレビューに関連付けられたreviewIdを持つバージョンが含まれています。
がありHashmap<Integer, Integer>
、レビューデータベースからレビューをインポートするたびに、を使用してマップに追加しますmap.put(reviewId, hostId)
。
レビューデータベースからインポートする前に、すでにインポートされているレビューを使用しているかどうかをハッシュマップに確認します。これはしばらくすると非常に遅くなり始めます。おそらく一時テーブルを使用する方が効率的かどうか疑問に思います。または、より効率的な別の方法がある場合。
コードは次のとおりです: https ://gist.github.com/4064373
考え、提案?