lucence と hadoop を使用して検索モジュールを配布する準備をしていますが、何かで混乱しました。
私たちが知っているように、hdfsは分散ファイルシステムです。ファイルをhdfsに配置すると、ファイルはいくつかのブロックに分割され、クラスター内の異なるスレーブマシンに保存されますが、luceneを使用してhdfsにインデックスを書き込む場合、各マシンのインデックスを表示するには、どうすればそれを達成できますか?
Hadoop/contrib/index の一部と katta を読みましたが、「シャードはインデックスの一部のように見えます」という考えを理解していません。それは、1 台のコンピューターのローカル ディスクまたは 1 つのディレクショナル ディストリビューションにのみ格納されていました。クラスター?
前もってありがとう