問題タブ [tidytext]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
359 参照

r - R でのテキスト マイニング .docx インタビュー トランスクリプション

テキストマイニング分析を実行したいと考えているインタビューの書き起こしがいくつかあります。基本的に、定性的なコーディング手順を自動化しようとしています。

私はtidytextテキストマイニングについて調べてきましたが、すでにインポートされたデータセットしか使用していないようです! .docx ファイルを R に実際にインポートして、tidytext 関数の使用を開始するにはどうすればよいですか?

トランスクリプトをインポートできるというGithub ( textreadr ) のパッケージを見つけましたが、データをロードするために使用されるコマンドを完全に追うことができません。

0 投票する
1 に答える
931 参照

r - ネストされたリスト列アプローチと Purrr を Tidytext::Unnest_Tokens と共に使用する

各行が異なる人物を表す調査回答を含むデータフレームがあります。1 つの列 (「テキスト」) は、自由形式のテキストの質問です。Tidytext::unnest_tokens を使用して、感情スコア、単語数などを含む各行ごとにテキスト分析を行いたいと思います。

この例の単純なデータフレームは次のとおりです。

次に、テキスト列を文字に変えました...

次に、id 列でグループ化し、データフレームをネストしました。

ここまでは順調に進んでいるように見えますが、どのように purrr::map 関数を使用して、入れ子になったリストの列 "word" を処理するのでしょうか? たとえば、dplyr::mutate を使用して各行の単語数を含む新しい列を作成したい場合はどうすればよいでしょうか?

また、「テキスト」列のみがネストされたリストになるようにデータフレームをネストするより良い方法はありますか?

0 投票する
1 に答える
956 参照

r - きちんとしたテキストで R コードが突然動作しなくなった

R で一部のデータに対して単語分析を実行しようとしています。read.csv を使用して、調査からのテキスト回答であるデータの 1 つの列を R にインポートしました。列の 1 つに「text」という名前を付けました。このコードは数日前は正常に機能していましたが、突然エラーが発生します。これは私が入力しているコードです:

私が今得ているエラーは次のように言っています:

check_input(x) のエラー: 入力は任意の長さの文字ベクトル、またはそれぞれの長さが 1 の文字ベクトルのリストでなければなりません。

データは変更されませんでした。使用しているコードも変更されませんでした。:(なぜこれが起こっているのかよくわかりません.Rにはかなり慣れていません...以前にロードしたことがあり、気づかなかったロードする必要がある別のパッケージはありますか?

ここに私のデータへのリンクがあります: https://www.dropbox.com/s/amg12jp9qx98slz/A1.csv?dl=0

ご協力いただきありがとうございます