5

私はPHP開発者です。今それを邪魔にならないようにしましょう。しかし、Hadoop特にMahout は、私の興味をそそりました。それらを使用するために、Javaに飛び込む準備ができています。

では、十分な経験を積んだ人々から、これらを効果的に使用するには、どれだけのJavaが必要なのでしょうか。私が見てきたことから、マッパー/リデューサーのプログラミングはそれほど多くはかかりません。しかし、Mahoutを使用すると、ドキュメントを見るときに何を見ているのかまったくわかりません。

また、HadoopとMahoutを介してJavaで処理するためにPHPアプリケーションからデータを取得するのはどれほど難しいでしょうか?そんなに難しいとは思えませんが、言うほどの経験はありません。

4

4 に答える 4

7

MahoutとHadoopを使用して分析するために、PHPからJavaにデータを取得することはそれほど難しいことではありません。

さらに簡単なのは、MahoutとHadoopをオフラインでバッチモードで使用して処理し、データ製品をファイルシステムまたはデータベースに保存することです。PHPは、ログから削除するのと同じくらい簡単にこれらのデータ製品を読み取ることができます。

リアルタイムで使用するために、Mahoutの推奨部分は、PHPからのアクセスを非常に簡単にするさまざまなWebサービスインターフェイスをサポートしています。Mahoutのモデル評価部分をヒットするには、もう少しプログラミングが必要になります。

于 2010-07-22T19:51:08.363 に答える
1

初心者レベルのJavaで十分です。アドホックなニーズに基づいて、いつでも深く掘り下げることができます。

于 2010-08-18T21:26:40.420 に答える
1

私は同じことをしただけで、Javaに関連することは何年も前からやっています。私がしたことは次のとおりです。

  1. 簡単なHadoopストリーミングの例から始めました
  2. PHPストリーミングで自分の分析を試してください
  3. Pigの実験を開始しました
  4. Pig内でPHPストリーミングを使用して実験を開始します

すべてJavaなしで!

于 2010-12-08T18:26:10.257 に答える
0

リアルタイムの推奨事項については、Javaサーブレットクラスでmahoutのインスタンスをインスタンス化し、それをTomcatサーバーで提供するための戦争としてエクスポートすることもできます。

于 2011-08-19T23:47:26.460 に答える