問題タブ [deeplearning4j]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - DL4J は GoogleNews-vectors ファイルで非常に遅い
DL4Jで次の例を実行しようとしました(事前トレーニング済みのベクトルファイルをロードしています):
しかし、それは非常に遅いです(最も近い単語を計算するのに約10分かかりますが、それらは正しいです).
十分なメモリがあります(-Xms20g -Xmx20g
)。
https://code.google.com/p/word2vec/から同じ Word2Vec の例を実行すると
最も近い単語を非常に迅速に提供します。
DL4J は、Numpy の 2 倍の速さを主張する ND4J を使用します: http://nd4j.org/benchmarking
私のコードに何か問題がありますか?
更新: https://github.com/deeplearning4j/dl4j-0.4-examples.gitに基づいています(依存関係には触れず、Google の事前トレーニング済みベクター ファイルを読み取ろうとしました)。Word2VecRawTextExample は問題なく動作します (ただし、データ サイズは比較的小さいです)。
java - deeplearning4j - 名前付きエンティティの認識に Word2Vec を使用する
deeplearning4j を使用して、紙のNLP を (ほぼ) ゼロから複製しようとしています。次の手順を実行しました。
- SENNA 単語ベクトルをロードする
- CoNLL'03 データセットの反復子を作成します。各単語について、隣接する単語の単語ベクトルを連結して単語特徴ベクトルを形成します (ウィンドウ サイズ = 5)。
- 上記のデータセット反復子を使用して、単純な回帰レイヤーをトレーニングします。次に例を示します。
さまざまな構成を試しましたが、どれもうまくいきませんでした。モデルは、「O」タグを持つすべての単語を予測し続けます。私のアプローチの何が問題なのかを指摘していただければ幸いです。次にどのような手順を踏む必要がありますか? ありがとうございました!
intellij-idea - Intellij で処理できない DeepLearning4j の例の Maven プロジェクト
スクリーンショットに示されているように、intellij によってロードできない dl4j-0.4-examples プロジェクトの依存関係があります。
依存関係情報を取得できません: アーティファクト 'com.github.jai-imageio-core.jar' のメタデータ ファイルを読み取れません: プロファイル "java8-and-higher' の無効な JDK バージョン: 無制限の範囲 [1.8
この質問で解決された同様の問題
https://github.com/google/gson/issues/596
簡単な修正として、ローカル リポジトリで pom ファイルを開き、「)」を追加すると、次のようになります。
91 [1.8,)
保存して再度実行
ただし、この場合、jdk
タグ: がないため、そのアプローチは使用できません。
このプロジェクトを intellij にロードするための回避策を見つけた人はいますか?
java - org.nd4j.linalg.factory.Nd4jBackend$NoAvailableBackendException
それが私に何を望んでいるのかわかりません。私は使っている
どこ
しかし、私は得ています
Google ワード ベクトル モデルを読み込もうとすると、次のようになります。
java - Deeplearning4j から Spark パイプラインへ: String 型を org.apache.spark.mllib.linalg.VectorUDT に変換する
私は、リカレントニュートラルネットワークを使用して、特定の映画レビューが肯定的か否定的かを予測する感情分析プログラムを持っています。そのプログラムには Deeplearning4j 深層学習ライブラリを使用しています。次に、そのプログラムを Apache Spark パイプラインに追加する必要があります。
それを行うと、MovieReviewClassifier
拡張するクラスがありorg.apache.spark.ml.classification.ProbabilisticClassifier
、そのクラスのインスタンスをパイプラインに追加する必要があります。モデルを構築するために必要な機能は、setFeaturesCol(String s)
メソッドを使用してプログラムに入力されます。追加する機能はString
、センチメント分析に使用される一連の文字列であるため、フォーマットされています。ただし、機能は の形式である必要がありますorg.apache.spark.mllib.linalg.VectorUDT
。文字列を Vector UDT に変換する方法はありますか?
以下にパイプライン実装用のコードを添付しました。
Review は、ポジティブまたはネガティブとして予測される文字列を含む機能列です。
コードを実行すると、次のエラーが発生します。
java - DL4J - ノイズ除去オートエンコーダによる精度
積み重ねられたノイズ除去オートエンコーダ用に DL4J が提供するサンプル コードを実行しようとしています。しかし、私の結果は本当に悪いものでした:
結果がそれほど悪い原因になっている可能性があるかどうかは正確にはわかりません。私は MNIST データセットを使用しています。積み重ねられたノイズ除去オートエンコーダーのコードは DL4J によって提供されました。私のコードは以下の通りです:
ありがとう!
neural-network - ニューラル ネットワークで max 関数を回帰する
私はニューラルネットワークの学習について自分自身を訓練しています。ニューラル ネットワークに学習させることができない関数があります: f(x) = max(x_1, x_2)
. 2 つの入力と 1 つの入力を持つ非常に単純な関数のように見えますが、2000 エポックで 1000 サンプル以上のトレーニングを受けた 3 層ニューラル ネットワークは完全に間違っています。を使用してdeeplearning4j
います。
ニューラルネットワークの最大関数を学習するのが非常に難しい理由はありますか、それとも単にチューニングが間違っているだけですか?
machine-learning - DeepLearning4J - ParagraphVectors: 類似度がマイナスになるのはなぜですか?
DeepLearning4j フレームワークで ParagraphVector ツールを使用しています。私がやっていることは、一連のテキスト ドキュメントでモデルをトレーニングし、それらのドキュメント間の類似性を計算することです。
さて、参照ページ ( http://deeplearning4j.org/word2vec ) にあるように、ツールが類似度を計算するために使用するメトリックはコサイン類似度であり、これは 0 から 1 の間に含まれる必要があります。負のスコアを取得します。
それがなぜなのか誰にもわかりますか?
前もって感謝します。