問題タブ [feature-selection]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Rの「step」メソッドで選択した変数を取得します
「ステップ」関数を使用して、データから不要な/偽の変数を削除しています。私は次のコードを使用しています:
「step」メソッドによって選択された最終変数を知るにはどうすればよいですか?
編集:私は同じものを見つけるために以下を使用しています。他の簡単な方法を探しています。
machine-learning - 相関する特徴と分類精度
相関する特徴 (変数) が機械学習アルゴリズムの分類精度にどのように影響するかについて皆さんに質問したいと思います。相関する特徴とは、それらの間の相関を意味し、ターゲット クラス (つまり、幾何学的図形の周囲と面積、または教育レベルと平均収入) との相関ではありません。私の意見では、相関する特徴は分類アルゴリズムの精度に悪影響を及ぼします。相関によってそのうちの 1 つが役に立たなくなるからです。ほんとうにこうなのでしょうか?分類アルゴリズムの種類によって問題は変わりますか? 論文や講義に関する提案は大歓迎です!ありがとう
content-management-system - CMS の最も重要な機能
新しい CMS が登場し、そこにある機能を選択して評価できるとします。その中から5つ選んでください。1 位は最も重要なもの、3 位はそれほど重要でないものです。
- インプレース編集 (管理パネルなし)
- グローバル コンテンツ バージョン管理 (記事、ブログ エントリ、モジュール コンテンツ アイテムなど)
- 結果としての単一ページ アプリケーション (ページのリロードなし、純粋な ajax/web ソケット)
- 容易な拡張性(制御の反転、生産モジュールのコンパイルとインストール)
- IT 以外の人でも簡単に理解できるシンプルなコンセプト
- すべてのサイト データのインポート/エクスポート (サード パーティ製モジュールを含む)
- 任意の DB サポート (MSSql、MySQL、PostgreSQL、SQL CE...)
- 簡単なテンプレート システム ( Dust.js などの論理のないテンプレート)
- システムレベルの Web ソケットのサポート (サービス、ブラウザとサーバー間のデータ転送、サーバーからのリアルタイム データのプッシュ)
- かなりの量のビルド済みモジュールと機能
- 有料ではなくオープンソースであること (品質は低下する可能性がありますが)
- 私はむしろそれを(合理的な金額)支払うことを望みますが、バグがなく、完全にテストされ、完全にサポートされています
CMS を SaaS として購入できるようにするため
追加する必要があるもの:)
フィードバックをお寄せいただきありがとうございます。
xml - SVMを使用して、「特徴ベクトル」ではなく「特徴マトリックス」の入力でトレーニングサンプルを学習することは可能ですか?
SVMを使用して、「特徴ベクトル」ではなく「特徴マトリックス」の入力でトレーニングサンプルを学習することは可能ですか?各ドキュメントを機能マトリックスとして表すことにより、XMLドキュメントを分類する必要があります。通常、特徴ベクトルは、テキスト分類のためにSVMをトレーニングするために使用されます。ただし、XMLドキュメントを特徴ベクトルとして表すと、構造情報が失われる可能性があります。
前もって感謝します!
analysis - 感情分析、機能選択
感情を分析するための各ステップに適したツールは何かを知りたい: ストップワードの削除、ステミング、テキストのベクトル表現、特徴選択、分類、テキストのベクトル表現から特徴選択に渡す方法、従うべきステップはありますか?これらの手順を説明する例
r - R での SVM 機能選択
SVM 分類器をトレーニングしています。現在、約 4000 の機能がありますが、それらの多くは冗長で有益ではありません。モデルの機能を 20 ~ 50 程度に減らしたいと考えています。貪欲なヒル クライミングを使用して、フィーチャを毎回 1 ずつ減らしたいと思います。削除された機能は、最も重要でない機能である必要があります。SVM をトレーニングした後、機能の重要度のランキングを取得するにはどうすればよいですか? R で libsvm を使用している場合、各機能の重み、または他の同様の種類の重要度の指標を取得するにはどうすればよいですか? ありがとう!
machine-learning - 機能の選択
ディメンションとして用語を含む文書用語データがあります。用語について特徴選択を実行する必要があり、特徴選択を実行するための尺度として相互情報を使用するつもりです。ここでの私の疑問は、可能なすべてのペア間の相互情報量を計算した後、何をすべきかということです? しきい値を設定し、しきい値内にあるペアのすべての用語を選択する必要がありますか?
numpy - 数値属性を持つ公称値を処理するための戦略
私は SFDC の名目上の値 (例: EE 名、役職、役割、リード ソース、アカウント名など) で構成されるデータ セットを使用しており、その機能を、セールス リードがあったかどうかのブール値クラスに関連付けようとしています。営業担当者に変わりました。
このデータをいくつかの基本的な特徴選択アルゴリズムで実行したかったのですが、ほとんどの場合、数値のみが必要です。ブール マッピング スキームを使用して、一意の分類のそれぞれを新しいフィールド (機能) にマップできますが、非常に多数の新しい機能が生成され、意味のある出力が得られるかどうかはわかりません。確かに、最善の解決策はデシジョン ツリーを介してデータを実行することかもしれませんが、現実の世界でうまく使用されているほとんど名目上のデータのデータ セットを処理するために、他の人がコミュニティで思いついた他の戦略があるかどうかを確認したかったのです。アプリケーション。
私は scipy/numpy/pandas/scikit-learn で python を使用して分析を行っています。
javascript - OpenLayers 選択した機能のトリガー機能をクリックします
OpenLayers を使用して、クラスター戦略でマップ上にポイント フィーチャを描画しています。
また、SelectFeature を使用してマップ上のポイント フィーチャを選択しています。
ユーザーがクラスター化されたフィーチャーを選択すると、ポップアップが表示され、選択するフィーチャーが含まれているリストが表示されます。これらのいずれかを選択すると、ポップアップが閉じ、クラスター化された機能が選択されたままになります。
ここで問題が発生します。クラスター化された機能をクリックできるようにして、ポップアップが再び表示されるようにします。私ができる唯一のことは、toggle:true を設定することですが、機能が選択されていません。
ユーザーが選択した機能をクリックしたときにイベントをトリガーする方法はありますか?
前もってThx、illy
image-processing - 「視覚的に類似した」画像を取得するための概念的なクエリ: Dense SIFT またはその他の記述子?
画像が視覚的にどのように見えるかを示すために、データセットの 3 つの画像を投稿しています。
http://s1306.photobucket.com/user/Bidisha_Chakraborty/library/?page=1
VLFFeat DSIFT 実装を使用しています。記述子ごとに 8 ではなく 4 方向を使用しています。したがって、私の場合は 128 ではなく 64 次元のベクトルです。画像データはもともと固定距離から取得されているため、画像には元のスケールを使用しています。記述子を 4/8 ピクセル間隔で密に計算しています。ウィンドウ サイズを 80*80 ピクセルから 20*20 ピクセルに変更して、いくつかの実験を行いました。さまざまな数のクラスターセンターを使用してクラスター化アプローチを行いました。そして最後に、アースムーバーの Distance を使用して類似性メトリックを計算しました。ウィンドウ サイズ、単語数のさまざまなパラメータ調整の後、1 と 3 のようなほぼ類似した画像がある場合でも、距離メトリックは、画像 1 が画像 2 よりも画像 1 から画像 3 に類似していることを示しています。
主成分分析を行って、データの分散を確認しました。イメージ 1 とイメージ 2 はクラスターが分離していて、イメージ 1 と 3 はクラスターが重なっていると予想していました。最初の 3 つの次元をプロットしましたが、これらの 3 つの次元はデータの 30% 未満しか占めていないため、すべての次元 (もちろん視覚化できませんでした) を含めると、より悪い結果が得られると確信しています。
- SIFT は私のアプリケーションにとって最適なものではないと結論付けるべきでしょうか、それとも何かを見逃しているのでしょうか。これらにはすでに GLCM を使用しましたが、良い結果が得られませんでした。他の機能空間についての提案は大歓迎です。あらゆる種類の洞察に感謝します。