問題タブ [tidytext]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
621 参照

r - R - tidytext データでカウントする

Gutenberg プロジェクトのフロイトの本を使ってテキスト マイニングに取り組んでいます。次のコードを使用して、感情分析を実行しようとすると:

エラーが発生します:

mutate_impl(.data, ドット) のエラー: 評価エラー: 二項演算子への数値以外の引数。

問題はカウント関数の最後のブロックにあることがわかります。これについて何か助けはありますか?

0 投票する
2 に答える
204 参照

r - tidytext を使用して txt 形式でトークン化を実現する

texto_revision次の構造を持つ.txtファイルを使用して、tidytextで作業しようとしています:

formatを使用しようとするunnest_tokensと、次のコードで:

次のエラーが表示されます。

エラー: check_input(x) のエラー: 入力は任意の長さの文字ベクトル、またはそれぞれの長さが 1 の文字ベクトルのリストでなければなりません。

エラーを修正してトークン化を続行するために、次のコードを使用してテキストをデータ フレームに変換しようとしました。

しかし、私はまだ次のエラーが発生します

check_input(x) のエラー: 入力は任意の長さの文字ベクトル、またはそれぞれの長さが 1 の文字ベクトルのリストでなければなりません。

0 投票する
1 に答える
1174 参照

r - `top_n` と `arrange` を ggplot (dplyr) に渡す

TidyText マイニング セクション 3.3に素敵なコードの塊があり、それを自分のデータセットに複製しようとしています。ただし、私のデータでは、ggplot に降順でデータが必要であること、および特定のtop_n.

TidyText Mining からコードを実行すると、本に示されているのと同じチャートが得られます。ただし、これを自分のデータセットで実行すると、ファセット ラップに top_n が表示されず (ランダムな数のカテゴリが表示されるようです)、各ファセット内のデータが降順で並べ替えられません。

いくつかのランダムなテキスト データと完全なコードを使用してこの問題を再現できますが、問題を再現することもできますが、mtcarsこれには本当に混乱します。

次のグラフでは、ファセットごとに mpg が降順で表示され、各ファセットで上位1 つのカテゴリのみが表示されることを期待しています。それは私にとってもそうではありません。

しかし、私が本当に欲しいのは、このようなチャートを TidyText ブックのようにソートすることです (データは例のみ)。

0 投票する
2 に答える
227 参照

r - 順序付けられたバーとファセットを使用したグラフ

頻度に応じて順序付けられたバーでグラフを作成しようとしています。また、ファセットを使用して2つの変数を別々に使用しています。単語は、「n」変数で指定された値で並べ替える必要があります。したがって、私のグラフはtidytext book に表示される次のようになります。ここに画像の説明を入力

私のグラフの怒鳴り声は、単語が値で順序付けられていません。私の間違いは何ですか?: ここに画像の説明を入力 私のデータは例のようなものです:

本で提供されているコードに従って、私のデータに従って変更すると、コードは次のようになります。

は次のとおりdputです。d