次のオプションを検討しています。
senseidb [http://www.senseidb.com] これには固定スキーマとデータ ゲートウェイが必要です。そのため、データをプッシュする簡単な方法はありませんが、データ ストリームを提供します。データが構造化されておらず、あらゆる種類のログに共通する属性がほとんどない
riak[http://wiki.basho.com/Riak-Search.html]
vertica - コスト要因?
Hbase(+Hadoop エコシステム +lucene) - ここでの主な短所は単一のマシン上にあり、これはあまり意味がなく、これを中心に構築されるフリーテキスト検索機能については確信が持てません
主な要件は次のとおりです。 1. アーカイブのために何千もの着信要求を維持すると同時に、エンド ユーザーがフリーテキスト検索を実行できるようにするリアルタイム インデックスを構築する必要があります。
- ストレージ (ログ アーカイブ + インデックス) は最適化する必要があります