問題タブ [training-data]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1729 参照

opencv - 60x60 の検出ウィンドウの妥当なトレーニング画像サイズは?

特定のオブジェクトを検出するために、ブーストされた分類器 (OpenCV または Matlab のいずれかを使用) のカスケードをトレーニングします。

私の質問は、60x60 のウィンドウ検出サイズの場合、分類器をトレーニングするための無制限の時間がないことを考えると、画像サンプルをトレーニングするための妥当な解像度はどれくらいですか? 提供された画像の一部は 1200x600 ですが、これは不必要に大きく、縮小する必要があると確信しています。テスト用のデータセットには画像や動画が含まれている可能性がありますが、それらのデータセット内で検出されるオブジェクトはそれほど大きくない可能性が高いことはわかっています。

0 投票する
1 に答える
180 参照

opencv - 特徴として画像注釈を含めながら、カスケード分類器をトレーニングする

OpenCV のカスケード分類子が画像をトレーニングし、カスケード トレーナー自体が画像から抽出した機能を使用することを理解しています。しかし、画像にいくつかの注釈をトレーニングに追加することは可能ですか? たとえば、分類器をトレーニングするためのポジティブ サンプルとして使用する約 600 枚の画像がありますが、各画像に (「空撮」、「平面図」、または「都市の背景」などの追加機能の短いベクトルで注釈を付ける必要があります。 」または「風景の背景」)。

トレーナーが抽出した特徴と手動で提供された注釈を組み合わせた分類器を構築することは可能ですか?

0 投票する
2 に答える
604 参照

opennlp - OpenNLP NameFinder トレーニング、「予期しない注釈が見つかりました」

NameFinderME のトレーニング中に、次のエラー メッセージが表示されます。

私のデータは次のようになります。 <START someTag> some text <END>

Computing event counts... java.io.IOException: Found unexpected annotation:

Google がこのエラー メッセージについて私を見つけた他のすべてにおいて、それは常にトレーニング データの間隔の単純なエラーです (たとえば、に変更<START:entity>some text<END><START:entity> some text <END>ます。トレーニングを行うためにオブジェクトをセットアップしたときに、そのように指定しました.何が間違っている可能性がありますか?

ありがとうございました、

セイウチザキャット

0 投票する
0 に答える
520 参照

python - Python でのモデルのトレーニング

モデルを構築し、トレーニング セットでトレーニングする方法を学習しようとしています。以前に Python で MultinomialNB を使用してこれを行ったことがありますが、一連の方程式を使用してカスタム モデルを構築しようとはしていません。誰かが私を正しい方向に導いてくれますか? ご協力ありがとうございました。

そのため、MultinomialNB でモデルをトレーニングするときは、次のコードを使用します。

clf=MultinomialNB()
clf.fit(xtrain, ytrain)

私が今やろうとしているのは、タグ予測 A_i の方程式です。i は、特定の投稿に対して予測しているタグです。この方程式 A_i を使用してモデルをトレーニングする方法がわかりません。

0 投票する
0 に答える
440 参照

c++ - Tesseract-OCR で一部の単語 (トレーニング済み) を認識できない

現在、Tesseract-OCR を使用して画像内のテキストを認識していますが、質問があります。一部の単語を認識できないため、特別にトレーニングしましたが、まだ機能しませんでした。

DAWG ファイルなどの言語データをトレーニングするときに、追加のファイルが必要でしょうか。それについてはわかりません。単語がいくつかの特別な位置や方向に表示されたときに、それらのいくつかを認識できる場合があるためです。

本当に紛らわしいです。心からあなたの助けが必要です。前もって感謝します!

他の情報:

  1. 簡体字中国語を使用しています(中国語を使用するときに設定しなかったパラメータがあるかどうかはわかりません)。

  2. 私が認識したい絵はテーブルなので。その中にいくつかの行があります。精度を向上させるためにテーブルを認識するときに、この状況について何か考えを教えてください。

  3. 言葉の特殊な形が原因かどうかはわかりませんので。ここにいくつかの単語を直接貼り付けます。上下午一二三四五

どうもありがとう !

0 投票する
1 に答える
534 参照

audio - 制限付きボルツマン マシンを使用した音声特徴抽出

RBM (制限付きボルツマン マシン) を使用して音声特徴を抽出したい。このために、RBM への入力としてスペクトログラム (PCA 白色化) を与えています。
各オーディオ ファイルのスペクトログラムは、no の行列です。列数は固定されていますが、オーディオ ファイルごとに行数が異なります。このスペクトログラム行列が与えられた場合、RBM をどのようにトレーニングするか、または RBM を使用して音声から特徴を抽出する方法について質問します。Honglak Lee の論文を読みました。その論文のタイトルは、畳み込みディープ ビリーフ ネットワークを使用した音声分類のための教師なし機能学習です。http://machinelearning.wustl.edu/mlpapers/paper_files/NIPS2009_1171.pdf
「次に、フィルター長 6、最大プーリング比 3 で 300 の第 1 層ベースをトレーニングしました。」
まず、ここでいう塩基とは何か。(彼らは Convolutional Deep Belief Networks を使用しているので、基数はここでは重みを意味しないと思います)。
第二に、フィルター長を 6 にすることは何を意味するのでしょうか? どうすればいいですか?ヒントをいただければ幸いです。(私はRBMが初めてです)