問題タブ [word-cloud]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - テキストのブロックごとの R ワードクラウド検索頻度
次のようなフレーズを含むデータの CSV ファイルがあります。
ワードクラウドを使用して、文の各ブロック ( で割ったもの) の頻度を取得したいと考えています;
。ただし、得られるのは単語あたりの頻度です。
各セルのコンテンツ ブロックごとの頻度を取得する方法はありますか?
このおもちゃの例では、次のようになります。
事前にどうもありがとうございました
r - R比較.雲の角度位置
次のコードは、単純な比較クラウドを生成します。
2 つの質問があります。
1- 2 つの単語が複数のドキュメントで同じ頻度を持っている場合、パッケージがそれを 1 つのサブクラウド VS 他のサブクラウドに表示することをどのように決定するか
2- ドキュメントによると、「各単語 ... その角度位置は、その最大値が発生するドキュメントによって決定されます。」シードなしで比較クラウドを複数回実行しましたが、解釈を理解できませんでした。Google で説明を検索しましたが、あまり見つかりませんでした。このコンテキスト内で「角度位置」とはどういう意味ですか?
助けていただければ幸いです
MJJ
r - R - 2 つのコーパスを比較して、コーパス #1 から頻度の高い単語を含む新しいコーパスを作成する
似たような単語を含む 2 つのコーパスがあります。setdiff
を使用しても実際には私の目的に役立たないほど十分に似ています。そこで、より頻繁に使用される単語のリストまたはコーパス (最終的にワードクラウドを作成するため) を抽出する方法を見つける方向に向かいました (このようなものにしきい値があると仮定すると、おそらく 50% より頻繁になるのでしょうか?) コーパスで # 1、コーパス #2 と比較。
これは私が今持っているすべてです:
したがって、「wingspan」という単語の頻度がコーパス #2 (「SECcorpus」) では 100 カウントであるが、コーパス #1 (「コーパス」) では頻度が 150 である場合、その単語を結果のコーパス/リストに含める必要があります。