-1

いくつかの単語カウントアルゴリズムを使用しましたが、よく見ると、たとえば「それは」を1つの単語としてカウントするため、テキスト内の元の単語よりも少ない単語が出てきたのではないかと思っていました. それで解決策を見つけようとしましたが、うまくいきませんでした。そこで、「それは」のような「短い言葉」を「基本的な言葉」に変換する何かが存在するかどうかを自問しました。

4

2 に答える 2

0

基本的に、略語を対応する長いバージョンにマップするデータ構造を提供する必要があります。ただし、これは思ったほど単純ではありません。たとえば、「クライアントの車」を変換する必要はありません。「お客様は車」へ。

これらのケースを管理するには、おそらく、処理している言語とそれに組み込まれている文法規則をより深く理解しているヒューリスティックが必要になるでしょう。

于 2014-11-27T14:02:28.933 に答える