問題タブ [feature-extraction]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
2727 参照

opencv - OpenCV、SIFT : 2 つの異なる昆虫のすべての機能が一致しています

キャプチャした画像から昆虫を識別するための分類子を作成したいと考えています。最初は HuMoments を使用しましたが、HuMoments はスケール バリアントであるため、異なる解像度でキャプチャされた画像は正しくない結果をもたらしました。インターネットで検索したところ、SIFT と SURF を使用すると問題が解決することがわかったので、SIFT を使用するとどうなるかを調べてみました。下の最初の 2 つの画像は、異なる種類の昆虫に属しています。400 個の特徴のうちすべてが一致していたため、結果は奇妙でした (3 番目の画像を参照)。

ここに画像の説明を入力 ここに画像の説明を入力 ここに画像の説明を入力

質問 1: これら 2 つの画像ですべての特徴が一致しているのはなぜですか?

質問 2: 分類ツリー (ランダム ツリー) でトレーニングするために画像の特徴を保存できる方法 (XML ファイルなど) はどうすればよいですか?

0 投票する
1 に答える
3448 参照

speech-recognition - メル周波数ケプストラム係数 - 音声特徴抽出

私は現在、右クリック、左クリック、ダブルクリックなどのマウスイベントが音声コマンドとして与えられる音声認識に関連するプロジェクトを行っています。したがって、最初のステップとして、上司はメル周波数ケプストラム係数を使用して各音声コマンドの特徴を抽出し、抽出した特徴を LIBSVM 形式を使用してテキスト ファイルに保存するように私に言いました。私は、インターネットでいくつかの参照を使用して MFCC を実装しました。しかし、これがどこで正しいのかわかりません。MFCCの出力についてはよくわかりません。「正しい」と言うと、私のプログラムはこのようなものを与えます

  1. アウトプットの王様が MFCC から得られるべきものを誰か説明できますか
  2. MFCC から抽出された特徴を LIBSVM 形式で保存する方法。
  3. そして、私の問題に対する MFCC の正しい mathlab 実装を見つけるのを手伝ってくれる人がいます。
0 投票する
0 に答える
232 参照

ddos - DDoS 検出のための特徴抽出

NSL-KDD データセットを使用して、DDoS 検出アルゴリズムの入力ベクトルとして以下に定義されているいくつかの機能を抽出しようとしました。

機能 #2 と #4 は明示的な KDD 機能です。しかし、最初の機能のようなものは、パケットの情報が必要なようです。

NSL-KDD データセットからパケット情報を抽出できますか? はいの場合、その方法は?

特徴:

  1. 指定されたポートへの UDP エコー パケットの数。
  2. 指定された時間枠中の同じホストへの接続数。
  3. 同じ送信元からの ICMP エコー応答パケットの数
  4. 指定した時間帯に同じサービスを使用して SYN エラーが発生した接続の数
  5. 連続する 2 つのパケット間の時間差の分散
  6. 着信 SMTP パケットと発信 SMTP パケットの比率
0 投票する
1 に答える
393 参照

scikit-learn - sklearn を使用した交差検証のための高度な特徴抽出

1000 サンプルのデータを含むサンプル データセットが与えられた場合、10000 行のデータを取得するためにデータを前処理したいとします。したがって、データの元の各行は 10 個の新しいサンプルにつながります。さらに、モデルをトレーニングするときに、クロス検証も実行できるようにしたいと考えています。私が持っているスコアリング関数は、元のデータを使用してスコアを計算するため、生成されたデータではなく、元のデータでもクロス検証スコアリングが機能するようにします。生成されたデータをトレーナーに供給しているため (RandomForestClassifier を使用しています)、クロス検証に頼って元のサンプルに従ってデータを正しく分割することはできません。

やろうと思ったこと:

  • カスタム特徴エクストラクタを作成して特徴を抽出し、分類子にフィードします。
  • 特徴抽出器をパイプラインに追加し、たとえば GridSearchCv にフィードします
  • 元のデータを操作して、選択したパラメーターのセットを指定してモデルをスコアリングするカスタム スコアラーを実装します。

私が達成しようとしていることのためのより良い方法はありますか?

Kaggleで現在行われているコンテストに関連して質問しています

0 投票する
1 に答える
927 参照

opencv - OpenCVを使用して行を抽出して単純化する方法は?

私はスケルトン化されたイメージを持っています。OpenCVを使用して右の画像のような行を抽出して単純化するにはどうすればよいですか?

例

ありがとうございました。

アップデート

スケルトンのノードがあります。

スケルトン ノード

今のところ、同じ線上にある場合はポイントを結合する必要があります。どうすればいいですか?

結合点

その後、このパスを単純化します。やり方は分かると思いますが、もしよろしければアドバイスお願いします。

パスを簡略化