問題タブ [sentimentr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - センチメートル (R パッケージ) データ ディクショナリの変更
私はRパッケージsentimentr(トリンカーによる)の感情分析関数sentiment_by()を使用しています。ネゲーター、アンプ、デアンプを変更する方法を理解したいです。極性テーブルと原子価シフターを更新できました。
自分のドメインに合うように辞書をいじりたいです。たとえば、「イライラする経験-そのような悪いアプリに月額を支払うのはクールではありません。プロフェッショナルではありません」は、0の平均感情をもたらします。だから、辞書と重みをもう少し理解しようとしています
また、 Sentiment_by() 関数に渡す前に実行する特定のテキスト クリーンアップ ユーティリティがあるかどうかも理解したいと思います ( qdap のように)。センチメートル パッケージのこれらの側面に関するドキュメントはあまりありません。どんな助けでも大歓迎です
r - センチメートル(trinker)のセンチメント関数によって返される平均極性スコアの計算について明確にする必要があります
私はRパッケージsentimentr(トリンカーによる)の感情分析関数sentiment_by()を使用しています。次の列を含むデータフレームがあります: レビュー コメント 月 年 データフレームでsentiment_by関数を実行して、年と月に基づいて平均極性スコアを見つけたところ、次の値が得られました。
ここで、コメントのみに基づいてデータフレームでsentiment_by関数を実行し、結果のデータフレームで次の関数を実行して、年と月に基づいて平均極性スコアを見つけます。
次の結果が得られます。
私の理解によれば、どちらも同じ結果を返すはずです。間違っている場合は修正してください。2 番目のアプローチを使用する理由は、月と年の両方に基づいて極性を平均化する必要があり、さらに時間の遅延が発生するため、この方法を 2 回使用したくないためです。誰かが私がここで間違っていることを教えてもらえますか?
r - R で単語のリストを文のリストと照合しようとするときのパフォーマンスの問題
単語のリストを文のリストと照合し、一致する単語と文でデータ フレームを形成しようとしています。例えば:
期待される結果 (データフレーム) は次のとおりです。
これを実現するために、次のコードを使用しています。
一致させる 28,000 の文と 65,000 の単語があります。上記のコードは、タスクを完了するのに 45 秒かかります。現在のアプローチには多くの時間がかかるため、コードのパフォーマンスを改善する方法について何か提案はありますか?
編集:
文中の単語と完全に一致する単語のみを取得したい。例えば :
上記の場合、出力は次のようになります。
r - dplyr mutate が「エラー: 無効なサブスクリプト タイプ 'クロージャ'」エラーをスローする
私はdplyrのmutateでsentimentRでsentiment_byを使用しようとしています
これは例えば動作します:
content <- mutate(content, word_count = sentiment_by(story)$word_count)
しかし
これは例えば動作します:
content.sd <- mutate(content, word_count = sentiment_by(story)$sd)
エラーエラーが発生します:invalid subscript type 'closure'
しかし、sentiment_by(content$story[1])
動作します
どんな助けでも大歓迎です。
r - フランス語辞書付き Sentimentr パッケージ
要求に応じて、列 x と y を使用して、極性とシフターの辞書 (テストするためのいくつかの単語) を作成しました。
次のエラーが表示されます。
[.data.frame`(polarity_dt, word_dat[["words"]]) のエラー: 未定義の列が選択されました
助けてください。前もって感謝します。
よろしくお願いします