問題タブ [qdap]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 特殊文字を単語頻度マトリックスに保持する
いくつかのブランドをテキストで分析して、広告認知度などの KPI を見つけます。ただし、これまでのところ、特殊文字を含むブランドは私のコードによって破壊されています。
これは出力です:
H&M が h&m であり、2 つのブランドのように「h」と「m」ではないことを確認するパッケージまたは方法はありますか?
編集: wfm 関数には ... 引数があり、strip 関数を使用できるようにする必要があります。
残念ながら機能しません。
r - rm_stopwords 関数がリストを作成しないようにする
rm_stopwords
パッケージの関数を使用qdap
して、データ フレームのテキスト列からストップワードと句読点を削除しました。
この関数は、reviewText 列のリストを返します。
それを防ぐ方法(つまり、元の形式を維持する)、または列のリストを解除/ネスト解除して元の形式を返す方法についてのアイデアはありますか?
結果は元のデータ フレームのようになりますが、ストップワードと句読点はありません。
ここに小さなdputがあります:
r - 「qdap」パッケージのインストール
次のエラーが表示されます。