問題タブ [tidytext]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
201 参照

r - 経時的にグループごとに繰り返される文/単語/フレーズを見つける

各列が変数で、各行が観測値であるデータセットがあります(時系列データのようです。次のようになります(形式については申し訳ありませんが、データを表示できません):

ここに画像の説明を入力

個人またはグループが同じことを繰り返し言っているかどうかを知りたいです。私は n グラムに精通していますが、それは私が必要としているものではありません。どんな助けでも大歓迎です。 ここに画像の説明を入力

これは私が望む出力です:

悪いコメントをすべて編集して申し訳ありません。まだウェブサイトに慣れています。

0 投票する
1 に答える
172 参照

r - きちんとしたデータ フレーム: ドイツ語の文字が削除されています

次のコードを使用して、データ フレームを整然としたデータ フレームに変換しています。

ただし、これにより、ドイツ語の文字 üäöß が新しく作成された単語列から削除された整然としたデータ フレームが生成されます。たとえば、「wählen」は「w」と「hlen」の 2 つの単語になり、特殊文字が削除されます。

テキスト分析と用語の頻度を行うために、ドイツ語の単語の整頓されたデータフレームを取得しようとしています。

この問題にアプローチする方法について、誰かが私を正しい方向に向けることができますか?