問題タブ [apache-spark-mllib]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

2209 問題

0 投票する

1 に答える

8335 参照

scala - 機械学習の目的で「randomSplit」を使用して Scala でデータを分割する際の問題

こんにちは、私は MLlib が初めてで、Spark Web サイトでそれに関するドキュメントを読んでいます。次のコードで、トレーニング用に「0」、テスト用に「1」をキャッシュする必要がある理由を理解するのが困難です。

誰かが理由を理解するのを手伝ってくれますか? 私の知る限り、正と負のサンプルが必要なので、「1」は正、「0」は負になる可能性がありますが、なぜこのように分割されるのですか?

ありがとうございました！

2014-07-21T04:13:17.343

0 投票する

1 に答える

915 参照

scala - Spark 1.0.1 から KMeansModel.predict エラーが表示されるようになったのはなぜですか?

Scala(2.10.4 バージョン)を使用していますが、 1.0.1Sparkに移行しました。Sparkバージョンを調べて、スクリプトの 1 つが正しく機能していないことに気付きました。MLlibライブラリの k-means メソッドを次のように使用します。

KMeansModelという名前のオブジェクトがあるとしますclusters:

問題のメソッドと、コンパイルしようとしているときに受け取るエラーは次のとおりです。

KMeansModel のドキュメントには、predict関数には型の引数が必要であることが明確に記載されており、そのArray[Double]ような型の引数を入れていると思います (そうではありませんか?)。私が間違っていることについて何か提案があれば、事前に感謝します。

scala apache-spark k-means apache-spark-mllib predict

2014-07-25T12:20:18.193

0 投票する

1 に答える

352 参照

scala - REPL は RDD 値を返しますが、SBT はコンパイルされません

新しい Spark Shell REPL セッションから以下のメソッドを実行すると、すべて正常に動作します。ただし、このメソッドを含むクラスをコンパイルしようとすると、次のエラーが発生します

どちらの場合も、Spark 1.0.1 を使用しています。コード自体は次のとおりです。

これは MLLib チュートリアル (わずかに適応) から取得したもので、何が問題なのかわかりません。

scala apache-spark sbt apache-spark-mllib

2014-07-28T18:43:58.747

0 投票する

0 に答える

4024 参照

java - Spark: ネイティブ gpl ライブラリを読み込めませんでした

非常に単純な spark ジョブ (mllib の SGD でロジスティック回帰を使用する) を実行しようとすると、次のエラーが発生しました。

これは、ジョブを送信するために使用したコマンドです。

実際の Java コマンドは次のとおりです。

が設定されて-Djava.library.pathいないようです。上記の java コマンドも試して、ネイティブの lib ディレクトリをに指定しましたjava.library.pathが、それでも同じエラーが発生しました。これは、ネイティブ lib ディレクトリの内容です。

何が問題なのですか？ありがとう。

java hadoop apache-spark apache-spark-mllib

2014-08-07T03:53:15.477

0 投票する

1 に答える

2525 参照

scala - Apache Spark - MLlib - K-Means 入力形式

K-Means タスクを実行してモデルのトレーニングに失敗し、結果のメトリクスを取得する前に Sparks scala シェルから追い出されたいです。入力形式が問題なのか、それとも何か他のものなのかはわかりません。Spark 1.0.0 を使用し、入力テキスタイル (400MB) は次のようになります。

MLlib サンプルファイルでは float しか使用されていないため、最初の 2 つを使用できるかどうかはわかりません。だから私も最後の2つを試しました：

どちらの場合も私のエラーコードは次のとおりです。

私は何が欠けていますか？

scala apache-spark k-means apache-spark-mllib

2014-08-07T14:35:30.597

1 2 3 4 5 6 7 8 9 10

問題タブ [apache-spark-mllib]

scala - 機械学習の目的で「randomSplit」を使用して Scala でデータを分割する際の問題

scala - Spark 1.0.1 から KMeansModel.predict エラーが表示されるようになったのはなぜですか?

scala - REPL は RDD 値を返しますが、SBT はコンパイルされません

java - Spark: ネイティブ gpl ライブラリを読み込めませんでした

scala - Apache Spark - MLlib - K-Means 入力形式

Reference