問題タブ [mahout]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Hadoop インストールで mahout を実行する方法
Hadoop で mahout jar の例を実行する方法を見つけようとしています。mahout と hadoop を構成したので、hadoop dir に入力して、次のように入力します。
/Users/hadoop/hadoop-0.20.2/bin/hadoop jar /Users/hadoop/trunk/examples/mahout-examples-0.5-SNAPSHOT-job.jar org.apache.mahout.SpareVectorsFromSequenceFile -w -i ratings -o ratings_vectors
しかし、私は試みています。私の目標は、Grouplens データセットに対して Hadoop ジョブを実行することです。put コマンドを実行して、ratings.dat を Hadoop にアップロードしました。このコマンドは、常に次のようなものを提供します。
私の質問は次のとおりです。
- mahout を呼び出すには、hadoop dir に正しいパスを設定するにはどうすればよいですか?
org.apache.mahout.cf.taste.example.grouplens.GroupLensRecommenderEvaluatorRunner
を使用して、Hadoop でデータ rating.dat を計算するにはどうすればよいですか?
どうもありがとう、私は Hadoop と mahout から始めています ;)
apache - Apache Mahout を使用してデータを分類する
簡単な分類問題を解こうとしています。
問題:
テキストのセットがあり、コンテンツに基づいてそれらを分類する必要があります。
Mahout を使用したソリューション:
モデルを生成するには、入力をシーケンス ファイルに変換する必要があることを理解しました。はい、できました。では、テスト データをどのように分類すればよいでしょうか。20News の例では、正確性のみをテストしています。しかし、私は実際の分類をしたいです。
コードを書く必要があるのか、テスト セットを分類するために利用可能な既存のクラスを使用する必要があるのか わかりません。
java - mahout 数学クラスで行列を作成する際の問題
Math MAhout クラス DoubleMatrix2d で行列 3x4 を作成しています。開始するために次のようなものを書きました。
コンパイルに関するエラーが発生していますが、最初に知る必要があるのは、それを行う正しい方法であるかどうかです:)ありがとう!
apache - Apache Mahout LDA パッケージからの LDA パラメーターへのアクセス
Apache Mahout を使用して、30 個のドキュメントのコーパスで潜在的ディリクレ割り当てモデルを構築するテストを行いました。システムに Hadoop をインストールしていなかったので、Mahout をローカルで実行すると結果のモデルが得られました。推定された\alpha、\beta、\Phi、\Thetaのように、モデルパラメータにアクセスしたいと思います
これらにアクセスするにはどうすればよいですか?
/mahout lda -i /tf-vectors -o -k 4-v 27
学習アルゴリズムの反復ごとにフォルダーがあることがわかります(私は推測します)。それぞれに、アクセス方法がわからない単一のファイル part-r-0000 があります。
どんな助けでも大歓迎です。
hadoop - Mahoutに慣れるには、Mahout in Actionを購入する価値がありますか、それとも他のより良い情報源がありますか?
私は現在、Apache Mahoutの非常にカジュアルなユーザーであり、 MahoutinActionという本の購入を検討しています。残念ながら、私はこの本がどれほど価値があるかを知るのに本当に苦労しています-そしてそれがマニングアーリーアクセスプログラムの本である(したがって現在ベータ版の電子書籍としてのみ入手可能である)ので、私はできます本屋で自分を見てはいけません。
誰かがこれをMahout、および/またはMahout Webサイトを補足できる他のソースに慣れるのに良い(またはあまり良くない)ガイドとして推奨できますか?
hadoop - mahout と hadoop の使用
私は、共同フィルタリングに mahout と hadoop がどのように使用されるかを理解しようとしている初心者です。私は単一ノードのカサンドラをセットアップしています。カサンドラからデータを取得したい
最初に Hadoop をインストールし、次に mahout を Cassandra と連携させるための明確なインストール手順はどこにありますか?
python - ボトエラスティックmapreducejarジョブフローパラメーターの何が問題になっていますか?
botoライブラリを使用して、Amazons Elastic MapReduce Webサービス(EMR)でジョブフローを作成しています。次のコードでステップを作成する必要があります。
ジョブフローを実行すると、常に次のエラーのスローに失敗します。
これは、Javaコードを呼び出すEMRログの行です。
パラメータの何が問題になっていますか?Javaクラスの定義はここにあります:
machine-learning - 機械学習プラットフォームの選択
ユーザーとそのローン返済指標 (かかった時間、分割回数など) のデータセットがあります。ここで、ユーザーの過去のローン履歴を分析して、「X をローンした場合、彼らは Y 回の分割払いで Z 日かけて返済する可能性が高い」と言いたいと考えています。
これが私の見解です
- アルゴリズムは、返済習慣に従ってすべてのユーザーをグループ化するクラスタリング アルゴリズムです。
- SOM または K-Means を使用したい
私の質問は、これに適したプラットフォームはどれですか? これまでにMahoutを見てきました。
java - Pythonで同等のJavaのMahout
JavaベースのMahoutの目標は、スケーラブルな機械学習ライブラリを構築することです。Pythonに同等のライブラリはありますか?
extraction - 用語抽出にMahoutを使用することは可能ですか?
用語抽出にApacheMahoutを使用することは可能ですか?用語は単語またはフレーズにすることができます。