テキスト ファイルのインデックス作成と検索に lucene を使用しています。インデックス ファイルの保存に HDFS を使用できますか。
6768 次
2 に答える
2
タスクを交換します。Hadoop をどこで使用するかを考えるのではなく、まず、プロジェクトを実装するために何が必要かを考えます。そして、Hadoop が必要であることがわかった場合、それをどこでどのように使用するかが明らかになります。
1 つのヒント。ほとんどの場合、Hadoop も Lucene 自体も必要ありません。Solr ( Luceneの上に作成された検索サーバー) は、インデックス作成と検索用に特別に設計された分散セットアップを備えています。Nutchは、Web をクロールするための Solr のフロントエンドとして使用できます。Tikaは、あらゆる種類のオフライン ファイルを解析するのに役立ちます。
于 2013-01-10T08:14:12.273 に答える
0
すべてのデータが lucene ドキュメント ( lucene cache ) の形式で準備された後、Lucene が表示されます。ルセンのことはもうご存知のようですね。Hadoop の目的は、大きなタスクを小さなチャンクに分割することです。Hadoop の最初の使用法は、データを収集することだと思います。各 Hadoop ノードはデータを収集し続けることができます。lucene ドキュメントを作成する
于 2013-01-10T08:10:00.347 に答える