問題タブ [tidytext]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R - tidytext データでカウントする
Gutenberg プロジェクトのフロイトの本を使ってテキスト マイニングに取り組んでいます。次のコードを使用して、感情分析を実行しようとすると:
エラーが発生します:
mutate_impl(.data, ドット) のエラー: 評価エラー: 二項演算子への数値以外の引数。
問題はカウント関数の最後のブロックにあることがわかります。これについて何か助けはありますか?
r - tidytext を使用して txt 形式でトークン化を実現する
texto_revision
次の構造を持つ.txtファイルを使用して、tidytextで作業しようとしています:
formatを使用しようとするunnest_tokens
と、次のコードで:
次のエラーが表示されます。
エラー: check_input(x) のエラー: 入力は任意の長さの文字ベクトル、またはそれぞれの長さが 1 の文字ベクトルのリストでなければなりません。
エラーを修正してトークン化を続行するために、次のコードを使用してテキストをデータ フレームに変換しようとしました。
しかし、私はまだ次のエラーが発生します
check_input(x) のエラー: 入力は任意の長さの文字ベクトル、またはそれぞれの長さが 1 の文字ベクトルのリストでなければなりません。
r - `top_n` と `arrange` を ggplot (dplyr) に渡す
TidyText マイニング セクション 3.3に素敵なコードの塊があり、それを自分のデータセットに複製しようとしています。ただし、私のデータでは、ggplot に降順でデータが必要であること、および特定のtop_n
.
TidyText Mining からコードを実行すると、本に示されているのと同じチャートが得られます。ただし、これを自分のデータセットで実行すると、ファセット ラップに top_n が表示されず (ランダムな数のカテゴリが表示されるようです)、各ファセット内のデータが降順で並べ替えられません。
いくつかのランダムなテキスト データと完全なコードを使用してこの問題を再現できますが、問題を再現することもできますが、mtcars
これには本当に混乱します。
次のグラフでは、ファセットごとに mpg が降順で表示され、各ファセットで上位1 つのカテゴリのみが表示されることを期待しています。それは私にとってもそうではありません。
しかし、私が本当に欲しいのは、このようなチャートを TidyText ブックのようにソートすることです (データは例のみ)。
r - 順序付けられたバーとファセットを使用したグラフ
頻度に応じて順序付けられたバーでグラフを作成しようとしています。また、ファセットを使用して2つの変数を別々に使用しています。単語は、「n」変数で指定された値で並べ替える必要があります。したがって、私のグラフはtidytext book に表示される次のようになります。
私のグラフの怒鳴り声は、単語が値で順序付けられていません。私の間違いは何ですか?: 私のデータは例のようなものです:
本で提供されているコードに従って、私のデータに従って変更すると、コードは次のようになります。
は次のとおりdput
です。d