大量の文があり、単語の共起の無向エッジ リストを作成し、すべてのエッジの頻度を確認したいと考えています。パッケージを見てみましたが、tm
同様の機能は見つかりませんでした。使用できるパッケージ/スクリプトはありますか? どうもありがとう!
注: 単語はそれ自体とは共起しません。2 回以上出現する単語は、同じ文の中で 1 回だけ他の単語と共起します。
DF:
sentence_id text
1 a b c d e
2 a b b e
3 b c d
4 a e
5 a
6 a a a
出力
word1 word2 freq
a b 2
a c 1
a d 1
a e 3
b c 2
b d 2
b e 2
c d 2
c e 1
d e 1