1

私が現在直面している問題について、いくつかの提案を探しています。

イベントE1-E20が実行されるとトリガーされるS1-S100というセンサーのセットがあります。通常、E1 は S1-S20 をトリガーし、E2 は S15-S30 をトリガーし、E3 は S20-s50 などをトリガーし、E1-E20 は完全に独立したイベントであると仮定します。場合によっては、イベント E が他の無関係なセンサーをトリガーすることがあります。

各イベントを個別に分析するために、20 svm のアンサンブルを使用しています。私の機能は、センサー周波数 F1-F100、各センサーがトリガーされる回数、およびその他のいくつかの関連機能です。

センサー機能 (F1-F100) の次元を減らすことができる手法を探しています/またはすべてのセンサーを包含し、次元も減らすいくつかの手法 (ここ数日間、いくつかの情報理論の概念を探していました) . 平均化は考えていません。情報を失うリスクがあるため、最大化は良い考えです(良い結果が得られませんでした)。

誰かが私がここで欠けているものを提案できますか? 紙またはいくつかの開始アイデア...

前もって感謝します。

4

2 に答える 2

2

おそらく、Linear Discriminant Analysisから始めたいと思うかもしれません。これはかなり単純なアルゴリズムであり、多かれ少なかれあなたが探していることを行います: 次元削減および/または分類。各クラスは、平均は異なるが共分散は同じであるガウス分布であると想定しています。この仮定が妥当であることを確認するために、事前にデータの一部をプロットしておくことをお勧めします。以前に R で LDA 実装を使用したことがあります。ただし、これには約12の機能がありました。100次元にスケーリングする方法がわかりません。

また、データの次元を削減する理由を知ることも役立つ場合があります。SVM は通常、何十万もの (まばらな) 機能で使用されますが、どのような困難がありますか?

于 2010-12-29T09:47:29.313 に答える
0

これはあなたの質問に関連する素晴らしい記事です:http://en.wikipedia.org/wiki/Nonlinear_dimensionity_reduction

また、@ StompChickenが述べているように、SVMを数百の機能で動作させるのに問題はないはずです。何万もの機能で(運用上の)問題が発生し始めるはずです。

カルロス

于 2011-01-03T18:45:18.307 に答える