問題タブ [fasttext]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

398 問題

0 投票する

2 に答える

1793 参照

nlp - FastText を使用して不均衡なラベルデータを処理する方法は?

FastText では、ラベルのバランスが取れていません。それを処理する最良の方法は何ですか？

2018-06-10T08:02:05.467

0 投票する

1 に答える

10177 参照

python - Gensim Fasttext の事前トレーニング済みモデルは、語彙外の単語のベクトルをどのように取得しますか?

gensim を使用して、事前トレーニング済みの fasttext モデルをロードしています。英語のウィキペディアでトレーニングされたモデルを fasttext web サイトからダウンロードしました。

事前トレーニング済みのモデルをロードするために私が書いたコードは次のとおりです。

次のフレーズがボーカルに存在するかどうかを確認しようとします (これらは事前にトレーニングされたモデルであるため、めったにありません)。

そのため、「社内エグゼクティブ」というフレーズは語彙にはありませんが、それに対応する単語ベクトルはまだあります。

私の混乱は、Fastextが単語の文字ngramのベクトルも作成することです。したがって、単語「内部」の場合、単語全体を含むすべての文字 ngram のベクトルを作成し、単語の最終的な単語ベクトルは文字 ngram の合計になります。

しかし、どうすれば単語や文全体のベクトルを得ることができるのでしょうか? fastext ベクトルは単語とその ngram 用ではありませんか? では、明らかに 2 つの単語である場合、フレーズに対して私が見ているこれらのベクトルは何ですか?

python nlp gensim fasttext

2018-06-13T02:33:19.897

1 2 3 4 5 6 7 8 9 10

問題タブ [fasttext]

nlp - FastText を使用して不均衡なラベル データを処理する方法は?

python - Gensim Fasttext の事前トレーニング済みモデルは、語彙外の単語のベクトルをどのように取得しますか?

Reference

nlp - FastText を使用して不均衡なラベルデータを処理する方法は?