私はいくつかのデータを保存するためにmysqlサーバーをセットアップしている最中ですが、(今週末少し読んだ後)データを時間内にアップロードするのに問題があるかもしれないことに気付きました。
私は基本的に複数のサーバーで毎日のデータを生成し、それを共有キューに送信して処理/分析しています。データは約 50 億行です (ただし、データは非常に小さく、ID 番号が列にあり、int の辞書が別の列にあります)。私が見たパフォーマンス レポートのほとんどは、10 時間以上かかる 60 ~ 100k/秒の挿入速度を示しています。その日にデータに取り掛かることができるように、非常に迅速にデータが必要であり、その後、データを破棄する (または S3 などにテーブルを達成する) ことができます。
私に何ができる?(データベース サーバーに加えて) 8 台のサーバーを自由に使用できますが、それらを使用してアップロードを高速化することはできますか? 最初はそれらを使用して同時にサーバーにデータをプッシュすることを考えていましたが、それぞれにデータをロードして、どうにかしてすべての分離されたデータを1つのサーバーにマージしようと考えていますか?
私は innodb で mysql を使用するつもりでした (それが役立つ他の設定を使用できます) が、最終決定されていないため、mysql が機能しない場合は、他の何かがあります (以前に hbase を使用したことがありますが、最初に mysql ソリューションを探していました)。私が問題を抱えている場合、より広く使用され、助けを得やすいようです)?