0

私はBOWベクトルを持っています.sklearnまたはgensimに、高次元の教師付きデータを取得して、これらのクラス間の分散を保持する低次元空間に投影できる教師付き次元削減アルゴリズムがあるかどうか疑問に思っています.

実際、分類/回帰の適切なメトリックを見つけようとしていますが、次元を使用すると役立つと思います。監視されていない方法があることは知っていますが、途中でラベル情報を保持したいと考えています。

4

2 に答える 2

0

FastText - Facebook の調査からの実装であり、基本的に、求めていたものを達成するのに役立ちます。gensim について質問されたので、gensim の word2vec をご存知かと思います。

現在、word2vec は Google にいる間に Mikolov によって提案されました。Facebook ahs の Mikolov と彼のチームは、単語とサブワードの情報を考慮した fastText を考案しました。また、テキストの分類も可能です。

于 2016-08-31T08:43:46.057 に答える
-1

教師なしの方法または教師付きの方法でのみ次元削減を実行できますが、ターゲットラベルとは異なるラベルを使用します。

たとえば、100 個のトピックを含むデータセットを使用してロジスティック回帰分類器をトレーニングできます。トレーニング データを使用したこの分類器の出力 (100 個の値) は、次元削減された機能セットになる可能性があります。

于 2015-07-29T11:51:32.223 に答える