問題タブ [mahout]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
2373 参照

java - Hadoop インストールで mahout を実行する方法

Hadoop で mahout jar の例を実行する方法を見つけようとしています。mahout と hadoop を構成したので、hadoop dir に入力して、次のように入力します。

/Users/hadoop/hadoop-0.20.2/bin/hadoop jar /Users/hadoop/trunk/examples/mahout-examples-0.5-SNAPSHOT-job.jar org.apache.mahout.SpareVectorsFromSequenceFile -w -i ratings -o ratings_vectors

しかし、私は試みています。私の目標は、Grouplens データセットに対して Hadoop ジョブを実行することです。put コマンドを実行して、ratings.dat を Hadoop にアップロードしました。このコマンドは、常に次のようなものを提供します。

私の質問は次のとおりです。

  • mahout を呼び出すには、hadoop dir に正しいパスを設定するにはどうすればよいですか?
  • org.apache.mahout.cf.taste.example.grouplens.GroupLensRecommenderEvaluatorRunnerを使用して、Hadoop でデータ rating.dat を計算するにはどうすればよいですか?

どうもありがとう、私は Hadoop と mahout から始めています ;)

0 投票する
2 に答える
6674 参照

apache - Apache Mahout を使用してデータを分類する

簡単な分類問題を解こうとしています。

問題:
テキストのセットがあり、コンテンツに基づいてそれらを分類する必要があります。

Mahout を使用したソリューション:
モデルを生成するには、入力をシーケンス ファイルに変換する必要があることを理解しました。はい、できました。では、テスト データをどのように分類すればよいでしょうか。20News の例では、正確性のみをテストしています。しかし、私は実際の分類をしたいです。
コードを書く必要があるのか​​、テスト セットを分類するために利用可能な既存のクラスを使用する必要があるのか​​ わかりません。

0 投票する
2 に答える
535 参照

java - mahout 数学クラスで行列を作成する際の問題

Math MAhout クラス DoubleMatrix2d で行列 3x4 を作成しています。開始するために次のようなものを書きました。

コンパイルに関するエラーが発生していますが、最初に知る必要があるのは、それを行う正しい方法であるかどうかです:)ありがとう!

0 投票する
1 に答える
468 参照

apache - Apache Mahout LDA パッケージからの LDA パラメーターへのアクセス

Apache Mahout を使用して、30 個のドキュメントのコーパスで潜在的ディリクレ割り当てモデルを構築するテストを行いました。システムに Hadoop をインストールしていなかったので、Mahout をローカルで実行すると結果のモデルが得られました。推定された\alpha、\beta、\Phi、\Thetaのように、モデルパラメータにアクセスしたいと思います

これらにアクセスするにはどうすればよいですか?

/mahout lda -i /tf-vectors -o -k 4-v 27

学習アルゴリズムの反復ごとにフォルダーがあることがわかります(私は推測します)。それぞれに、アクセス方法がわからない単一のファイル part-r-0000 があります。

どんな助けでも大歓迎です。

0 投票する
6 に答える
5172 参照

hadoop - Mahoutに慣れるには、Mahout in Actionを購入する価値がありますか、それとも他のより良い情報源がありますか?

私は現在、Apache Mahoutの非常にカジュアルなユーザーであり、 MahoutinActionという本の購入を検討しています。残念ながら、私はこの本がどれほど価値があるかを知るのに本当に苦労しています-そしてそれがマニングアーリーアクセスプログラムの本である(したがって現在ベータ版の電子書籍としてのみ入手可能である)ので、私はできます本屋で自分を見てはいけません。

誰かがこれをMahout、および/またはMahout Webサイトを補足できる他のソースに慣れるのに良い(またはあまり良くない)ガイドとして推奨できますか?

0 投票する
3 に答える
9541 参照

hadoop - mahout と hadoop の使用

私は、共同フィルタリングに mahout と hadoop がどのように使用されるかを理解しようとしている初心者です。私は単一ノードのカサンドラをセットアップしています。カサンドラからデータを取得したい

最初に Hadoop をインストールし、次に mahout を Cassandra と連携させるための明確なインストール手順はどこにありますか?

0 投票する
3 に答える
1137 参照

python - ボトエラスティックmapreducejarジョブフローパラメーターの何が問題になっていますか?

botoライブラリを使用して、Amazons Elastic MapReduce Webサービス(EMR)でジョブフローを作成しています。次のコードでステップを作成する必要があります。

ジョブフローを実行すると、常に次のエラーのスローに失敗します。

これは、Javaコードを呼び出すEMRログの行です。

パラメータの何が問題になっていますか?Javaクラスの定義はここにあります:

https://hudson.apache.org/hudson/job/Mahout-Quality/javadoc/org/apache/mahout/cf/taste/hadoop/similarity/item/ItemSimilarityJob.html

0 投票する
5 に答える
1089 参照

machine-learning - 機械学習プラットフォームの選択

ユーザーとそのローン返済指標 (かかった時間、分割回数など) のデータセットがあります。ここで、ユーザーの過去のローン履歴を分析して、「X をローンした場合、彼らは Y 回の分割払いで Z 日かけて返済する可能性が高い」と言いたいと考えています。

これが私の見解です

  1. アルゴリズムは、返済習慣に従ってすべてのユーザーをグループ化するクラスタリング アルゴリズムです。
  2. SOM または K-Means を使用したい

私の質問は、これに適したプラットフォームはどれですか? これまでにMahoutを見てきました。

0 投票する
5 に答える
10195 参照

java - Pythonで同等のJavaのMahout

JavaベースのMahoutの目標は、スケーラブルな機械学習ライブラリを構築することです。Pythonに同等のライブラリはありますか?

0 投票する
1 に答える
357 参照

extraction - 用語抽出にMahoutを使用することは可能ですか?

用語抽出にApacheMahoutを使用することは可能ですか?用語は単語またはフレーズにすることができます。