誰かが以下の問題にどのように対処できるか教えてもらえますか?
HDFSに保存されているテキストファイルがたくさんあります。クライアントアプリケーションは、特定の検索ワードの関連ファイルを見つける必要があります。ApacheSolrで可能かどうか知りたいのですが。どんな助けでも大歓迎です。
ありがとう、アルン
考える必要がある最初の質問は、検索がリアルタイムで行われるか (インデックスは非常に頻繁に更新されるか)、それともそれほど頻繁ではないかということだと思います。前者の場合は、Elastic Search を使用することを強くお勧めします。そして、私のアドバイスだけに頼らないでください。この質問には、Elastic Search と Solr の議論に対する非常に良い回答がいくつかあります。
また、Apache Solr での Hadoop の使用に関する質問については、インターネットで見つけた便利なリンクをいくつか紹介します。
http://www.likethecolor.com/2010/09/26/using-hadoop-to-create-solr-indexes
http://architects.dzone.com/articles/solr-hadoop-big-data-love