Apache Nutch を学びたいと思っており、Amazon Web Services (AWS) にアカウントを持っています。AWS には 3 台のマシンがあり、そのうちの 1 台はマイクロ サイズ、もう 1 台は小型サイズ、もう 1 台は中型サイズです。小さいサイズから始めたいので、Nutch、Hadoop、Hbase をインストールします。私のマシンにはCentos 6があります。
ここに質問がありますが、私は尋ねません: Nutch 2.1 (HBase, SOLR) with Amazon Web Services
どちらのアプローチが優れているかを学びたいです。小型機に搭載したい。その後、マイクロサイズを追加したいと考えています。一方、Nutch については経験がないので、ローカルで作業する必要があるのでしょうか、それとも自分のマシンと AWS の両方を使用する可能性はありますか (AWS からのデータのコピーは有料になる可能性があります)。
Nutch にラッパーを実装したい場合、(ソース コードを取得するために) ローカルにインストールし、AWS で実行する必要があります。
何か案は?