0

私は2つの文字列を持っています -

"I like running around the track.

I like swimming in the pool, but only in the morning.

上記の 2 つのコメント (running around the trackswimming in the pool.

テキスト分析ジェムまたはその種の情報を取り込む他の方法を推奨する人はいますか? 単語数や n-gram は必ずしも必要ではありません。単語「 」に関連してどの単語が表示されるかを知りたいだけですlike

4

2 に答える 2

0

The Stanford Parserなどの依存関係パーサーを使用し てテキストを解析し、センチメント ディクショナリでキー ワードを見つけて、曖昧さをなくすために依存関係の種類に制約を加えることができます。たとえば、依存関係のタイプは「dobj」(直接オブジェクト) である必要があります。次に、必要に応じて、依存構造を句または文の終わりまでたどります。

于 2013-10-23T18:37:02.003 に答える
0

手早く修正するには、Regex を使用して「like」のすべての形式を検索し、そこと句読点または改行文字の間のすべてのテキストを引き出すことができます。

于 2013-10-14T21:09:05.907 に答える