問題タブ [training-data]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
1316 参照

sentiment-analysis - Google Prdection API を使用した感情分析のトレーニング モデル

感情分析にGoogle Prediction APIを使用する予定です。このためのトレーニング モデルを生成するにはどうすればよいですか? または、商用利用できる標準トレーニング モデルをどこで入手できますか? Google Prediction API の Prediction Gallery で提供され ているSentiment Predictorを試してみましたが、うまく動作しないようです。

0 投票する
1 に答える
1876 参照

opencv - 透明度のある画像を使用した OpenCV haar トレーニング

OpenCV のカスケード トレーニング関数を使用します。しかし、その前にトレーニング データを準備する必要があります。陽性サンプルに透過性がある場合、OpenCV がそれをサポートできるかどうかを知りたいだけですか? たとえば、分類器に車両の外観を学習させたい場合、透明な背景に車両が立っているポジティブ サンプル画像を提供できますか?

0 投票する
2 に答える
4883 参照

kernel - SVM: VC 次元とカーネル次元数の関係

Thorsten Joachims による SVM-light を使用して、SVM のトピックを調べています。

現在、いくつかの紹介論文によると:

「R nの有向超平面の集合の VC 次元は n+1 [...]」

「C = inf の場合、最適な超平面は、データを完全に分離するものになります (存在する場合) [...]」

私は 2 次元の線形分離可能なデータセットを準備しており、非常に多くの図からわかっている 2 次元のハード マージン分類器を見たいと思っていました。

そこで、次のパラメータを選択しました。

  • 多項式カーネル (a*b+c) d (d = 2 )
  • C = 999 (infに近づくように)

3 つのサポート ベクターを取得しましたが、これは問題ありませんが、推定 VC 次元は 10,000 を超えています。

カーネルが 2 次元のみの場合、これほど高い VCdim を持つことができるのでしょうか?

0 投票する
1 に答える
1693 参照

opencv - Opencv createsamples ユーティリティ: タイトな境界ボックスは、トリミングされていない画像を正のサンプルに置き換えますか?

カスケードトレーナーで使用するopencvのポジティブサンプルとして使用したい画像が1000枚近くあります。

この優れたチュートリアルを読みました: http://note.sonots.com/SciSoftware/haartraining.html、およびこれ: http://www.computer-vision-software.com/blog/2009/11/faq -opencv-haartraining/ですが、createsamples ユーティリティの -w および -h パラメーターと、画像をトリミングするというアイデアをどうするかを決めるのに苦労しています。

多くの背景コンテンツを含む大きな画像 [1300x600] があるため、カスケード分類器によって実際に検出する必要があるオブジェクトは通常、画像の約 10% を占めます。

画像をトリミングしてから、OpenCV の createsamples ユーティリティを使用する必要がありますか? または、クロッピング部分を省略してもかまいません。ポジティブ サンプルの記述ファイルには、関心のあるオブジェクトを囲むバウンディング ボックスの x 座標と y 座標、高さと幅が含まれているからです。「バックグラウンドが多すぎる」とパフォーマンスが台無しになるとどこかで読んだので、混乱しています。人が画像内のオブジェクトに対してタイトな境界ボックスを既に指定している場合、「背景が多すぎる」ということはありますか?

ここでの私の主な問題は時間です。分類子のパフォーマンスが最終的に損なわれないのであれば、1000 枚の画像を手動でトリミングすることは避けたいと思います。


編集

私は実際に少しトリミングを行いました。サンプルの平均的な分布は次のとおりです。

車1 車2 車3 車4 車5 車6 車7

0 投票する
2 に答える
4045 参照

matlab - Matlabでニューラルネットワークを段階的に訓練する方法は? 繰り返し組み合わせます

私は非常に大きな列車セットを持っているので、Matlab. そして、大規模なトレーニングを行う必要があります。

トレーニングセットを部分に分割し、ネットワークを繰り返しトレーニングし、反復ごとに上書きする代わりに「ネット」を更新することは可能ですか?

以下のコードはアイデアを示しており、機能しません。各反復で、トレーニングされたデータセットのみに応じてネットを更新します。

0 投票する
1 に答える
776 参照

machine-learning - 大規模なトレーニング セットと小さなメモリでニューラル ネットワークをトレーニングする方法

GPU コンピューティングを使用して、バックプロパゲーションを使用して独自のニューラル ネット ライブラリを作成しています。トレーニングセットがGPUメモリに収まるかどうかを確認する必要がないことを普遍的にしたい。

トレーニング セットが大きすぎて GPU メモリに収まらない場合、ニューラル ネットワークをどのようにトレーニングしますか? ホストのRAMに収まると思います。

最初のピースでトレーニング反復を実行し、デバイスで割り当てを解除して、2 番目のピースをデバイスに送信し、その上でトレーニングする必要があります...そして、勾配の結果を合計します。

PCIe バスを介してすべてのデータをプッシュする必要がある場合、遅すぎませんか? もっと良いアイデアはありますか?

0 投票する
26 に答える
15025 参照

java - CountNonDivisible - コディリティ トレーニング タスク

私は今、コディリティのトレーニングをしています。自分で解決できるタスクもありますが、一部のタスクには問題があります。このタスクの難易度は<**>です。ミディアムですが、失速しました。

問題:


N 個の整数で構成される、空でないゼロ インデックスの配列 A が与えられます。0 ≤ i < N のような各数値 A[i] について、A[i] の約数ではない配列要素の数をカウントします。これらの要素は非除数であると言います。たとえば、次のような整数 N = 5 と配列 A を考えてみましょう。

次の要素の場合:

関数を書く:

これは、N 個の整数で構成される空でないゼロ インデックスの配列 A を指定すると、非除数の数を表す整数のシーケンスを返します。シーケンスは次のように返されます。

  • 構造体 結果 (C)、
  • または整数のベクトル (C++ の場合)、
  • またはレコード結果(パスカル)、
  • または整数の配列 (他のプログラミング言語)。

たとえば、次のようになります。

上記で説明したように、関数は [2, 4, 3, 2, 0] を返す必要があります。と仮定する:

  • N は [1..50,000] の範囲内の整数です。
  • 配列 A の各要素は [1..2 * N] の範囲内の整数です。

複雑:

  • 予想される最悪の場合の時間の複雑さは O(N*log(N)) です。
  • 予想される最悪の場合のスペースの複雑さは O(N) であり、入力ストレージを超えています (入力引数に必要なストレージは数えません)。

入力配列の要素は変更できます。


私はいくつかの解決策を書きました。しかし、私のソリューションはかさばり、まだ O(n^2) の複雑さがあります。それを最適に行うためのアイデアやアルゴリズムを教えてもらえますか? 面接の仕事でも何でもない。私はただトレーニングをしていて、すべてのタスクを解決しようとしています。このタスクは次の場所にあります: http://codility.com/demo/train/レッスン 9、レッスンの最初のタスク。

ありがとうございました!

0 投票する
1 に答える
3750 参照

opencv - OpenCVポジティブサンプルの次元?

そのため、OpenCV の haartraining およびカスケード トレーニング ツールに関する多くのチュートリアルに出くわしました。特に、createsamples ツールを使用して車の分類器をトレーニングすることに興味がありますが、-w パラメーターと -h パラメーターに関して矛盾するステートメントがいたるところにあるようで、混乱しています。私はコマンドを参照しています:

次の 3 つの質問があります。

  • ポジティブ サンプルのアスペクト比は、上記の -w および -h パラメータから得られるアスペクト比と同じである必要があることを理解しています。しかし、すべての陽性サンプルの -w および -h パラメータも同じサイズでなければなりませんか? 例えば。1000枚近くの画像があります。トリミング後、すべて同じサイズにする必要がありますか?

  • サイズではなくアスペクト比が問題である場合、OpenCV ツールで言及されている -w および -h パラメータと比較して、正のサンプルのアスペクト比をどの程度正確に一致させる必要がありますか? つまり、分類器は非常に敏感なので、あちこちで数ピクセルずれてもパフォーマンスに影響しますか? または、画像がすべてほぼ同じ比率である限り、画像を操作しても安全だと言えますか?

  • すでにいくつかの画像を同じサイズにトリミングしています。しかし、それらをすべて同じサイズにしようとすると、バウンディング ボックスに含まれる背景が他よりも少し多くなり、余白がわずかに異なるものもあります。(たとえば、下の 2 つの画像を参照してください。大きな車は画像の大部分を占めていますが、小さな車の周囲には広い余白があります)。このような画像のコレクションを持っていても問題ないのか、それとも分類器の精度が低下するので、対象のすべてのオブジェクト (この場合は車) の周りにより厳密な境界ボックスを確保する必要があるのでしょうか?

大きい車 小型車

0 投票する
1 に答える
1773 参照

opencv - OpenCV でのカスケード トレーニング用に回転した画像のポジティブ サンプルを作成する

車両とさまざまな視野角を検出するために、カスケード分類器をトレーニングする必要があります。私はOpenCVを使用しています。

以下に示すように、キャプチャする必要がある角度によっては、画像内の車両の配置が斜めになります。

ここに画像の説明を入力

ここでの問題は、車両が画像を横切って斜めに配置されているため、画像が長方形でなければならないという理由だけで切り抜くことができない不要な背景がたくさんあることです。オブジェクトの斜めに配置された角度/パースペクティブのポジティブ サンプルを作成する別の方法はありますか? オブジェクトのこの特定のビューを認識できるようにするには、分類器が必要です。車は長さと幅に大きな違いがないので、上の車ではそれほど悪くはありません. しかし、たとえば幅よりも数倍長いトラックで同じことを行うと、以下のように、画像は目的のオブジェクトよりも多くの背景を持つことになります。これが分類に良いのか悪いのか、また何か解決策はないかと悩んでいます。

分類器は、車両が背景でどのように回転しているかに関係なく、車両の特定の角度を認識しますか? その場合、トラックが水平/垂直になるようにトラックの画像全体を回転させてから、画像の残りの部分を切り取った方がよいでしょうか?

ここに画像の説明を入力