問題タブ [training-data]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
2208 参照

android - tesseractの言語設定を英語から他の言語に変更するには?

http://gaut.am/making-an-ocr-android-app-using-tesseract/に従って、英語で (tesseract を使用して) Android 用のシンプルな ocr アプリケーションを正常に構築できました。

英字を認識できるようになりました。しかし、言語設定を英語から他の言語に変更するにはどうすればよいですか? 元インド諸語

インド語のトレーニング済みデータをダウンロードし、英語に置き換え、それに応じて一部のコードを変更しました。しかし、それは結果として現れません。

0 投票する
1 に答える
659 参照

visual-c++ - VisualC++エクスプレスカスケード分類子画像クエリを使用したOpenCV2.4.3

手ジェスチャ認識プロジェクトの実装を学んでいます。このために、色情報、背景の減算、さまざまなオブジェクトのセグメンテーション手法を使用するいくつかのチュートリアルを実行しました。

ただし、使用したいのはカスケード分類器を使用する方法ですが、このアプローチについてはあまり理解していません。私はいくつかのテキストと論文を読み、その理論を理解していますが、カスケード分類子をトレーニングするのに適した画像が何であるかはまだわかりません。自然なカラー画像またはキャニーエッジ検出またはその他の方法で処理された手のジェスチャーを使用した画像でトレーニングする方がよいでしょうか。

また、openTLDと同様のオンライントレーニングとテスト方法を使用する方法はありますが、手順が説明されています。2.3-2.4.3のopenCVドキュメントは、http: //docs.opencv.org/doc/tutorials/objdetect/cascade_classifier/cascade_classifier.htmlで入手可能なコードを除いて、機械学習とオブジェクトの認識と追跡に関して不完全です。

これは長い質問ですが、問題を徹底的に説明したいと思います。オンラインコードを使用するよりも、概念を理解するのに役立ちます。

よろしくお願いします!

0 投票する
1 に答える
1064 参照

matlab - HMMmatlab統計ツールボックスで放出マトリックスを定義する方法

Matlabでの画像処理は初めてですが、MatlabStatisticalツールボックスでHMMを使用した文字認識に取り組んでいます。

入力画像の幅:400、高さ:100があり、画像はバイナリ画像です。各入力画像を10個の水平ブロックに分割しました。各ブロックで、画像の濃度を計算します。したがって、各画像で10個の特徴ベクトルを取得できます。

Fが画像の特徴ベクトルであると仮定します

F = [26 55 74123186260258 75 43 21]

私の質問は、特徴ベクトルをhmmシーケンスに変換して、hmmtrainコマンドを使用して使用できるようにする方法です。私の場合の放出マトリックスは何ですか?

この質問をする前に、私はOmidSakhiによる同様の例を見ました。しかし、私はまだ理解していません。

0 投票する
0 に答える
143 参照

training-data - 一般化を促進するためにデータを中心化/正規化するのはいつですか?

高次元のデータ セットが与えられ、PCA またはその他の次元削減手法をデータに適用すると、多くの場合、センタリングと正規化が必要になります。トレーニング/テスト/検証セットに分割するデータ セットを指定すると、センタリングと正規化はトレーニング セットに対してのみ実行し、各変数の値 (平均値/標準偏差) を保存する必要があるようです。次に、検証/テストのエラー率を計算するときに、これらのパラメーターの固有の値ではなく、トレーニング データに対して計算された値に対応して、検証/テスト データ セットを中央に配置し、正規化する必要があります。これは一般的に正しいですか?

0 投票する
2 に答える
4481 参照

opencv - OpenCV Haartraining は永遠に終わらない

opencvのhaartrainingを使うのはこれが初めてです。

練習用に、35 枚のポジ画像と 45 枚のネガ画像を使用しました。

でもデータからトレーニングしようとすると、 永遠に終わらず、

パラメータを極端に調整した場合でも。

(最小ヒット率 = 0.001、最大誤警報率 = 0.999

この極端な値のため、それほど時間はかからないと思います)

私の実験では何が間違っているのでしょうか?

これが私のコマンドとパラメーターです。

そして結果。

0 投票する
1 に答える
3214 参照

ms-access - C# - Emgu Cv - 顔認識 - Access データベースにバイナリとして保存された顔のトレーニング セットを、顔認識のために EigenObjectRecognizer にロードする

Ms Access データベースから顔認識を行うメイン フォームにトレーニング セットをロードするのに苦労しました。トレーニング セットを、その名前と ID とともに、OLE オブジェクト形式のバイナリ データとしてデータベースに保存しました。データベースとトレーニング セットのデータを変更、保存、読み取るために使用した方法は次のとおりです。

変換されたバイトデータをデータベースに保存するために使用する方法は次のとおりです。

このバイナリデータを読み取るために使用する方法は次のとおりです。

トレーニング セット/画像をバイナリ データとしてデータベースに正常に保存しました。問題は、これらのトレーニング セットを認識用にロードするときです。

データベースに顔が保存されている場合でも、フォームが読み込まれるとキャッチでメッセージが表示されます。私は EigenObjectRecognizer を使用しており、必要に応じてコードを投稿します。

0 投票する
2 に答える
2727 参照

stanford-nlp - Stanford NER: 使用してテストできる新しいトレーニング セットを作成するにはどうすればよいですか?

私の理解では、トレーニング ファイルを作成するには、言葉をテキスト ファイルに入れます。次に、各単語の後に、タグ (PERS、LOC など) とともにスペースまたはタブを追加します。

また、サンプル プロパティ ファイルからワード パッドにテキストをコピーしました。分類子に入力して使用できる gz ファイルにこれらを取得するにはどうすればよいですか?

でも案内してください。私は初心者で、テクノロジーにかなり不慣れです。

0 投票する
0 に答える
399 参照

machine-learning - weka KnowledgeFlow 環境を使用して実際のデータにトレーニング セットを適用する

YouTubeで多くのチュートリアルを行った後、答えが見つかりませんでした...

2 つの arff ファイルがあり、1 つは実際のテスト結果、クラスは 0 ~ 48 の数値、もう 1 つは '?' です。クラスとして。

10 倍の交差検証 REPtree を使用しましたが、かなり低いエラーが発生しました。

私の問題は、私が持っている「予測できない」データにこのトレーニング セットを適用するために weka を使用する方法がわからないことです。トレーニング セットはオンライン アンケートに回答したユーザーで構成され、もう 1 つのファイルはアンケートに回答しなかったユーザーです。

これが私が持っている実際のセットアップのスクリーンショットです。 ここに画像の説明を入力

どうもありがとうございました!!