hadoop - アマゾンウェブサービスとローカルでのSolr+HadoopとNutch+Hbaseの統合

Question

アマゾンウェブサービスにマシンがあり、いくつかの検索機能を試しています。AWSマシンにNutchとHbaseをインストールしました。

例としてwikipedia.orgをクロールしましたが、クロールされたデータはクラウドのHbaseに保存されます。

Solrをインストールして検索したい。システムをクラスターとしてインストールしなかったのは、調査したいだけです。つまり、どのように使用できるかなどです。

私の質問は、Hadoopがこのシステムのどこに立っているかです（私はまだHadoopをインストールしていません）？ローカルコンピューターにHadoopとSolrをインストールするのは論理的ですか。また、次の課題は、ローカルコンピューターとAWSコンピューターをどのように通信できるかです。

score 0 · Accepted Answer

Nutch をインストールした場合は、クロールと解析を処理する Hadoop が既に存在します。Nutch によって生成されたデータを取得し、Solr にプッシュしてインデックスを作成できます。

1 に答える 1