大規模なデータベースのデータ マイニングを行っているプロジェクトがあります。私は現在、すべてのデータをテキスト ファイルに保存しています。代わりにデータ リレーショナル データベースを保存することのコストと利点を理解しようとしています。ポイントは次のようになります。
CREATE TABLE data (
source1 CHAR(5),
source2 CHAR(5),
idx11 INT,
idx12 INT,
idx21 INT,
idx22 INT,
point1 FLOAT,
point2 FLOAT
);
妥当なパフォーマンスで、このようなポイントをいくつ獲得できますか? 現在、約 1 億 5000 万のデータ ポイントがあり、おそらく 3 億を超えることはないでしょう。4 つのデュアルコア 2GHz Xeon CPU と 8GB の RAM を搭載したボックスを使用していると仮定します。