問題タブ [qdap]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
210 参照

r - R tm/qdap - 用語に基づいてドキュメントを取得する

ドキュメント (この場合はツイート) に含まれる可能性のある用語に基づいてドキュメントを特定する方法を見つけようとしています。

このデータ フレーム (df) があるとします。これは、Twitter ユーザーのスクリーン ネームとそのツイートの 1 つのリストで構成されています。

さて、このデータフレーム内で、特定の用語を含むツイートを取得したいと思います-たとえば、「ツイート」-それらを次のように新しいデータフレーム(df2)に抽出します:

tm または qdap パッケージを使用してそれを行う方法があるに違いないと思います。しかし、何も見つけることができなかったので、この混乱になってしまいました。

コーパスをクリーンアップした後、termDocumentMatrix に変換します

次に、興味のある用語が Term Document Matrix のどの行にあるかを特定します。

サブセット - 用語が複数回言及されている場合

文書番号(行番号)を取得

t.tw - 用語に言及しているツイートのみを含む新しいデータ フレームを作成し、to - 他のツイートを作成します。

ご協力いただきありがとうございます。

上記の恐ろしいコードが熟練した R ユーザーの気分を害した場合は、お詫び申し上げます。

0 投票する
1 に答える
679 参照

r - qdap の sentSplit() には、エンドマークがない場合に問題があります

極性分析に qdap パッケージを使用しています。CSV ファイルには、「Sucks to not be removed」(ピリオドなし) のような句読点のない文があります。データフレームで使用sentsplitした後、この行は NA を示しています。

Rで不完全な文にエンドマークを追加するにはどうすればよいですか? これを止める方法はありますか?

0 投票する
4 に答える
12364 参照

r - 4M 行のコーパスと DTM を作成するより効率的な手段

私のファイルには 4M を超える行があり、ベイジアン分類器に渡すことができるように、データをコーパスおよびドキュメント用語マトリックスに変換するより効率的な方法が必要です。

次のコードを検討してください。

出力:

私の質問は、コーパスと DTM をより速く作成するために何を使用できるかということです。30万行を超えると非常に遅くなるようです。

使えると聞いたことがありますdata.tableが、よくわかりません。

パッケージも見ましたが、qdapパッケージをロードしようとするとエラーが発生し、さらにそれが機能するかどうかもわかりません。

参考文献 http://cran.r-project.org/web/packages/qdap/qdap.pdf

0 投票する
1 に答える
1361 参照

r - qdap ngram極性辞書

親愛なる Stackoverlow クラウド

qdap 極性関数を使用して、sentiWS に基づいて独自の辞書を読み込んで、いくつかのブログ エントリの極性を計算することができました。現在、単一の単語だけでなく、フレーズも含む新しい感情辞書 ( SePL ) があります。たとえば、「simply good」の場合、「simply」は否定語でも増幅語でもありませんが、より正確になります。それで、qdapの極性機能を使用してngramを検索できるかどうか疑問に思っていました。

例として:

与えます:

ただし、次のような出力を取得したいと思います。

誰でもそのように機能させる方法を考えていますか?

万歳、ベン

0 投票する
2 に答える
829 参照

r - R: 文字列を照合して置換します。mgsub が機能しない

2 つのデータ フレームがあります。最初のデータ フレームlibは、2 列に単語を含むライブラリです。2 番目のデータ フレームdata1は、次のように変換する必要があります。 lib$V2に対して列data1$V1で一致した文字列は、列lib$V1の対応する行の文字列に置き換える必要があります。

最終的なデータ フレーム data1.final は次のようになります。

qdapパッケージの mgsub 関数でこれを試しました。

しかし、何も変わっていません。何か案は?

0 投票する
2 に答える
268 参照

r - 絵文字ベースの感情

私は感情に取り組んでおり、R でqdapを使用して、絵文字を絵文字の気分を表す言葉に置き換えたいと考えています。

誰かがそれを行う方法を手伝ってもらえますか。さらに出力を使用して、テキストの全体的な感情を取得します。