Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
Nutch と Hadoop の統合に最適な Linux のディストリビューションを見つけようとしています。Nutch を介して大きなコンテンツをクロールするためにクラスターを使用することを計画しています。この質問についてさらに説明が必要な場合はお知らせください。
ありがとうございます。
この場合、主要なLinuxディストリビューションに大きな違いはありません。ただし、Hadoopパッケージが用意されているものをお勧めします。私はDebianでClouderaのHadoopディストリビューションを使用していますが、非常にうまく機能します。
hadoop および hbase パッケージは、次の Debian 安定版に含まれます。
http://packages.debian.org/search?keywords=hadoop