5

tm パッケージを使用して、用語ドキュメント マトリックス内の特定の単語に関連付けられた単語を検索しようとしています。

私はこれを行うために使用findAssocsしています。の引数は次のfindAssocsとおりです。

  • x: 用語-ドキュメント マトリックス。
  • term: 用語を保持する文字。
  • corlimit: 相関限界の下限の数値。

私は一貫numeric(0)して私の結果として得ています

例:

findAssocs(test.dtm, "investment", 0.90)
>numeric(0)

誰かがfindAssocs私が間違っていることに精通していて、知っていますか? numeric(0)または、結果が何を意味するかをより広く知っている人はいますか?

よろしくお願いいたします。

4

4 に答える 4

2

私は同じ を取得しています。これはnumeric(0)、私の にドキュメントが 1 つしかないためだと思います。Corpusしたがって、document term matrix列は 1 つだけです。TermDocumentMatrix()があるかどうかをテストして確認することをお勧めしますmulti-column matrix。とはいえ、1 つのドキュメント内で関連付けを見つけるにはどうすればよいでしょうか。

于 2012-10-06T19:38:04.927 に答える
2

この結果は、0.90 の文書に「投資」という用語に関連付けられた単語がないことを示しています。0.05 などの低いしきい値を試して、用語が少なくなるしきい値まで上げてください。

于 2012-09-28T05:33:01.707 に答える