5

Windowsで実行されているアプリケーションでMahoutを使用しようとしています。k-meansを使用してLuceneインデックスからクラスターを構築したいと思います。

シーケンスファイルを作成する(luceneインデックスからベクターを作成する)必要があるとすぐに、HadoopがWindows環境(chmodなど)で不明なプログラムへのコマンドライン呼び出しを行うため、Hadoop-Exceptionが発生します。Eclipseからアプリを実行できるようにしたいので、Cygwinで実行することはできません。

だから私の質問は

  • Luceneインデックスからベクターを取得するためにシーケンスファイルを作成する必要を回避する方法はありますか?
  • または、Windows環境でシーケンスファイルを作成する方法はありますか?
  • 4

    3 に答える 3

    4

    Windows 環境で Hadoop を実行できる唯一の方法は、Cygwin をインストールすることです。詳細については、次のブログ投稿を参照してください。

    http://hayesdavis.net/2008/06/14/running-hadoop-on-windows/

    Cygwin は、Hadoop が依存するすべてのコマンドライン ユーティリティ (chmod など) を提供します。必要に応じて、Eclipse 内から Hadoop ジョブを実行することもできます。

    于 2010-04-30T19:57:32.657 に答える
    1

    SequenceFileAPIを知っていますか?こちらをご覧ください:http://hadoop.apache.org/common/docs/current/api/org/apache/hadoop/io/SequenceFile.html 自分でデータの書き込み/読み取りを試みることができます。

    WindownsのEclipseからスタンドアロンモードでMahoutを実行できると思います。しかし、あなたはいくつかの欠点と障壁を目にするでしょう。あなたはどこまで来るか試してみるべきです。

    私の意見では、Eclipseから象使いを実行することを主張するべきではありません。;-)

    于 2010-05-03T08:59:57.180 に答える
    0

    仮想マシンを使用して Hadoop 環境を実行できます。私にとって、最善の解決策はhttp://hortonworks.com/プロジェクトを使用することです。すべてがきれいに機能します。

    于 2014-03-29T09:00:06.500 に答える