問題タブ [feature-extraction]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
5 に答える
16625 参照

image-processing - HoG 機能はどのようにグラフィカルに表現されますか?

「人間検出のための方向勾配のヒストグラム」から方向勾配のヒストグラム機能を実装しています。結果を視覚化したいと思います。これらの機能に関するすべての論文は標準的な視覚化を使用していますが、これらがどのように生成されるかについての説明は見つかりません。説明や役立つリンクをいただければ幸いです。

0 投票する
2 に答える
1515 参照

audio - JAudioパッケージをJavaプログラムに埋め込む

うんみんな;
コンテンツ ベースの音楽分析 (音楽ジャンルの分類と類似性測定) がメディア プレーヤーのシャッフル機能の曲選択をどのように改善できるかについて、最終年度のプロジェクト (BSc) を行っています。JAudio を埋め込んで特徴抽出を実行したいと考えています。sourceforge.net/projects/jaudio/ からパッケージをダウンロードし、http://jaudio.sourceforge.net/jaudio10/embedding.htmlに示されている手順を使用しています。ただし、いくつかの問題が発生しています。

  1. クラス Batch を使用すると、 setFeatures(java.io.File[] files) または setFetaures(RecordingInfo[] files) を使用するように指示されます。ただし、 http://jaudio.sourceforge.net/jaudio10/javadoc/index.htmlの API によると、そのよう な方法はありません。
  2. 次のステップは Batch.exectue() です。ただし、これは Null Pointer Exception をスローします。
  3. また、GUI を使用しようとすると、ファイル チューザー (録音の追加) がファイル (.wav) をロードしません。

プロジェクトで JAudio を使用したいと思っています。しかし、上記の理由により、私はそれを行うことができません。まず、JAudio を埋め込んで同じ問題が発生したことがある人がいるかどうか疑問に思っていました。そうでない場合、同様の機能を抽出するパッケージの代替プログラムを知っている人はいますか?


よろしくお願いいたします。

0 投票する
1 に答える
3863 参照

c++ - OpenCV HOG機能データレイアウト?

私は OpenCV の CPU バージョンの Oriented Gradients ( HOG ) のヒストグラムを使用しています。4x4 セル、4x4 ブロック、ブロック間のオーバーラップなし、および 15 個の方向ビンを含む 32x32 画像を使用しています。OpenCVHOGDescriptorでは、長さ 960 の 1D 特徴ベクトルが得られます。(32*32 ピクセル) * (15 方向) / (4*4 セル) = 960 であるため、これは理にかなっています。

ただし、これらの 960 の数値がメモリ内でどのように配置されているかはわかりません。私の推測では、次のようになります。

もちろん、これは 2D の問題を 1D にフラット化したものなので、実際には次のようになります。

では、データ レイアウトについて正しい考えを持っているでしょうか。それとも別のものですか?


これが私のコード例です:


関連リソース: この StackOverflow の投稿このチュートリアルは、OpenCV HOGDescriptor を使い始めるのに役立ちました。

0 投票する
2 に答える
931 参照

image-processing - 勾配の圧縮ヒストグラム (CHOG)

Stanford Mobile Visual Search 出版物からの低ビットレート記述子 Compressed Histogram of Gradients (CHoG) の実装を理解しようとしています。OpenCV で利用できるオープンソース コードはありますか?

0 投票する
5 に答える
30170 参照

python - テキスト分類のための特徴選択と削減

私は現在、プロジェクトに取り組んでいます。これは、別々のケースで2 つと 3 つのクラスが存在するような単純なセンチメント アナライザーです。私は、ユニークな単語の手段がかなり豊富なコーパスを使用しています(約 200.000)。特徴選択には bag-of-words法を使用し、ユニークな特徴の数を減らすために、出現頻度のしきい値による除去が行われます。最終的な機能セットには約 20,000 の機能が含まれており、実際には90 % 減少していますが、十分ではありませんテスト予測の意図された正確さのために。私はLibSVMSVM-lightをトレーニングと予測 (線形RBF カーネルの両方) に順番に使用し、 PythonBashも一般的に使用しています。

これまでに観察された最高の精度は約 75%、少なくとも 90% が必要です。これは二項分類の場合です。マルチクラス トレーニングの場合、精度は~60%に低下します。両方のケースで少なくとも 90% が必要ですが、それを増やす方法がわかりません:トレーニング パラメーターの最適化または機能選択の最適化を介して?

テキスト分類における特徴選択に関する記事を読んだことがありますが、3 つの異なる方法が使用されていることがわかりました。これらの方法は、実際には相互に明確な相関関係があります。これらの方法は次のとおりです。

  • bag-of-words (BOW)の頻度アプローチ
  • 情報取得(IG)
  • X^2 統計(CHI)

最初の方法はすでに私が使用している方法ですが、私は非常に単純に使用しており、十分に高い精度を得るためには、より適切に使用するためのガイダンスが必要です. また、 IGCHIの実際の実装に関する知識が不足しており、そのように導くための助けを探しています。

ありがとうございました。さらに詳しい情報が必要な場合はお知らせください。


  • @larsmans: Frequency Threshold : 単語が異なる例で十分頻繁に発生している場合、その単語が一意の機能として機能セットに含まれるように、例で一意の単語の発生を探しています。

  • @TheManWithNoName: まず、文書分類の一般的な懸念事項を説明してくれてありがとう。私はあなたが提案したすべての方法と他の方法を調べて実験しました。特徴選択には比例差(PD) 法が最適であることがわかりました。特徴はユニグラムであり、重み付けには用語存在(TP) です (用語-周波数-逆-文書-周波数(TF- IDF) をインデックス作成方法として使用するのではなく、機能の重み付けアプローチ と見なします)。おっしゃったように、前処理もこのタスクの重要な側面です。データの精緻化と形態学的解析のために特定のタイプの文字列除去を使用し、ステミング。また、英語とは異なる特徴を持つトルコ語に取り組んでいることにも注意してください。最後に、バイナリ分類で最大 88% の精度(f 測定) 、マルチクラス最大 84%の精度に到達することができました。これらの値は、私が使用したモデルの成功の確固たる証拠です。これは私がこれまで行ってきたことです。現在、クラスタリングとリダクション モデルに取り組んでおり、LDALSIを試し、 moVMFとおそらく球面モデルに移行しています。(LDA + moVMF) は、ニュース コーパスのような客観的な性質を持つコーパスでうまく機能するようです。これらの問題に関する情報やガイダンスがあれば、よろしくお願いします。特に、特徴空間の次元削減方法 (LDA、LSI、moVMF など) とクラスタリング方法(k-means、階層型など)の間のインターフェイス (Python 指向、オープンソース) をセットアップするための情報が必要です。

0 投票する
1 に答える
4004 参照

image - scikit-learn (コンピューター ビジョン用) で自分のデータセットを操作するにはどうすればよいですか?

scikit-learn で自分のデータセットを操作するにはどうすればよいですか? Scikit チュートリアルでは、常に例として彼のデータセット (数字データセット、花のデータセットなど) をロードします。

http://scikit-learn.org/stable/datasets/index.html すなわち: sklearn.datasets から load_iris をインポートします

私は自分のイメージを持っていますが、新しいイメージを作成する方法がわかりません。

特に、最初に、私が見つけたこの例を使用します(ライブラリopencvを使用します):

機械学習アルゴリズムの実装に役立つ方法で、一連の画像の特徴を抽出したいと思います!

0 投票する
1 に答える
42481 参照

opencv - OpenCVでローカルバイナリパターンヒストグラムを計算するには?

OpenCV が LBPヒストグラムに基づく分類子を提供することは既に確認しました。

しかし、LBP ヒストグラム自体にアクセスしたいと考えています。例えば:

OpenCVでこれを実行する関数はありますか?

0 投票する
5 に答える
5421 参照

machine-learning - 動的なサイズの入力コレクションを使用して機械学習の問題に取り組む方法は?

機械学習を使用してデータサンプルを高品質または低品質に分類しようとしている問題に取り組んでいます。

データサンプルはリレーショナルデータベースに保存されます。サンプルには、属性ID、名前、賛成票の数(品質の良し悪しを示すため)、コメントの数などが含まれます。また、データサンプルIDを指す外部キーを持つアイテムを含むテーブルもあります。アイテムには、重みと名前が含まれています。データサンプルを指すすべての項目が一緒になってデータサンプルを特徴付けます。これは通常、データサンプルの分類に役立ちます。問題は、1つの外部キーを指すアイテムの数がサンプルごとに異なることです。

ニューラルネットワークなどの機械学習入力に、特定のデータサンプルを指すアイテムをフィードしたいと思います。問題は、アイテムの数がわからないため、必要な入力ノードの数がわからないことです。

Q1)入力次元が動的な場合にニューラルネットワークを使用することは可能ですか?もしそうなら、どのように?

Q2)リストの長さが不明な場合に、タプルのリストをネットワークに供給するためのベストプラクティスはありますか?

Q3)リレーショナルデータベースに機械学習を適用するためのベストプラクティスはありますか?

0 投票する
1 に答える
163 参照

affinetransform - 一致した asift 機能のシミュレートされたアフィン変換を回復します (モレルの実装)

ASIFT 特徴検出器のシミュレートされたアフィン変換を回復しようとした人はいますか? (著者の実装から)。元の論文では、シミュレートされたアフィンは式 2.2 によって明確に回復されますが、これが実行される明確なポイントを見つけることができないようです。誰も前に試したことがありますか?compute_asift_keypoints.cpp の関数compensation_affine_coor1は私が探しているもののようですが、スケールは正規化されているようで、変換を実行する座標の中心は明確ではありません。

0 投票する
1 に答える
2294 参照

image - scikit-learn-csvファイルで画像特徴データセットを生成する

1つの画像から2つのエッジ特徴(ホグ特徴とソーベル演算子)を抽出します。

Scikit-learn pythonでiris_datasetのような画像特徴データセットを作成するにはどうすればよいですか?ライブラリには、データセットを表すcsvファイルがあります。数字のみを含むcsvファイル。これらの数字はどのように生成されましたか?特徴抽出?

残念ながら、私はここでJavaチュートリアルしか見ませんでしたhttp://www.coccidia.icb.usp.br/coccimorph/tutorials/Tutorial-2-Creating- ...、5ポイントでトレーニングマトリックス(平均および共分散)の生成について話します分散行列)?これらのトレーニング配列を生成するScikitの関数はありますか?