ツイートを収集し、twitter ストリーミング api を使用して Lucene インデックスに格納したいと考えています。solr インデックスの最大サイズは 2 TB になります。次に、インデックスをクエリして結果をファイルに返す Web インターフェイスを作成したいと考えています。使用される Web サーバーは ApacheTomcat7 (Ubuntu 12.04 32 ビット/64 ビットで実行) です。データのクエリと取得の応答時間を 1 秒未満にしたい。
この要件を満たすには、サーバーをどのように構成する必要がありますか?Elastic Search に変更すると役立つでしょうか?クラウド コンピューティングに移行する必要がある場合は、どのような構成にする必要がありますか?つまり、どのくらいの容量のコンピューターが何台あるのか?クラウドについてよく知らないコンピューティング?
助けてください