ここで少しテスト/pocを実行しています。
毎日数百万行をデータベースにロードする必要があります。そして、それはログファイルデータではありません。リレーショナルデータベースに正確に適合する(列の)コンマ区切りの行があります。
ロード後、非常に高速な検索メカニズムを許可する必要があります。Googleによるbigtableの実装とその周りの構造を少し見て、私は当初、hbaseと統合されたハイブを使用することを考えました。クエリ機能があるため、ハイブ。読み込みは正常に機能し、RDBMSのパフォーマンスよりも優れています。ただし、そもそもRDBMSに代わるものを探す理由であったクエリのボトルネックは、ハイブでも続いています。
クエリ用にハイブをテストすることは、実際には驚くべきパフォーマンスではありません。おそらく私は代替案を探す必要があります。
他に何かありますか?hbaseの上に置くことができる他のツール/ソリューション/ライブラリはありますか?またはhbaseなしでも?(私はhbaseをRDBMSの代替として見て、distコンピューティングに移行しました)
提案をお願いします...