0

アマゾンウェブサービスにマシンがあり、いくつかの検索機能を試しています。AWSマシンにNutchとHbaseをインストールしました。

例としてwikipedia.orgをクロールしましたが、クロールされたデータはクラウドのHbaseに保存されます。

Solrをインストールして検索したい。システムをクラスターとしてインストールしなかったのは、調査したいだけです。つまり、どのように使用できるかなどです。

私の質問は、Hadoopがこのシステムのどこに立っているかです(私はまだHadoopをインストールしていません)?ローカルコンピューターにHadoopとSolrをインストールするのは論理的ですか。また、次の課題は、ローカルコンピューターとAWSコンピューターをどのように通信できるかです。

4

1 に答える 1

0

Nutch をインストールした場合は、クロールと解析を処理する Hadoop が既に存在します。Nutch によって生成されたデータを取得し、Solr にプッシュしてインデックスを作成できます。

于 2013-03-09T07:33:52.000 に答える