問題タブ [text2vec]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
521 参照

r - R の曲線の肘/膝

私はこのデータ処理を持っています:

このような質問がたくさんあることは承知していますが、自分の状況に対する正確な答えを見つけることができませんでした. 上の図では、潜在的ディリクレ配分モデルの 3 から 25 トピック番号までの perplexity 計算を示しています。それらの中で最も十分な値を取得したい、つまり、結果が次のようになる単純な数値ベクトルとしてのみ考慮される可能性のある値について、肘または膝を見つけたいと考えています。

これはプロットがどのように見えるかです

ひじは 13 か 16 になると思いますが、完全にはわかりません。結果として正確な数が必要です。この論文で、f''(x) / (1+f'(x)^2)^1.5 が膝の公式であることが分かりました。

私はこのことを完全に理解することはできません。結果として困惑に応じて正確な理想的なトピック数を取得する方法を誰かが共有したいと思いますか?

0 投票する
1 に答える
269 参照

r - コーパス内の 2 つの単語を R で結合する

だからここに私のコードがあります

私の .csv は、ニューヨーク タイムズの記事です。「new york」、「south africa」、「ellis island」などの単語を語彙で組み合わせて、「new」、「york」などのトークンだけでなく、組み合わせたいと思います。

これどうやってするの ?

ありがとうございました

より正確にするために:私はこれらのライブラリを使用しています

  • たとえば、私の結果について

1 "翼を待っている大統領選挙の可能性を持つLEAD知事クオモは、翼を待っている大統領選挙の可能性がある2期目のニューヨーク州最高経営責任者のLEAD知事クオモを大晦日に宣誓しました...