私は自然言語処理の正式なバックグラウンドを持っていません.NLP側の誰かがこれに光を当てることができるかどうか疑問に思っていました. 私はNLTKライブラリをいじっていて、特にこのパッケージが提供するストップワード機能を調べていました:
[80]: nltk.corpus.stopwords.words('english')
アウト[80]:
[「私」、「私」、「私」、「私自身」、「私たち」、「私たち」、「私たち」、「私たち自身」、「あなた」、「あなた」、「あなた」、「あなた自身」、「あなた自身」、「彼」、「彼」、「彼」、「彼自身」、「彼女」、「彼女」、「彼女」、「彼女自身」、「それ」、「それ」、「それ自体」、「彼ら」 、「彼ら」、「彼ら」、「彼ら」、「彼ら自身」、「何」、「どれ」、「誰」、「誰」、「これ」、「あれ」、「これら」、「それら」、「 am', 'is', 'are', 'was', 'were', 'be', 'been', 'being', 'have', 'has', 'had', '持つ」、「する」、「する」、「した」、「する」、「a」、「an」、「the」、「and」、「but」、「if」、「or」、「because」 , 'as', 'until', 'while', 'of', 'at', 'by', 'for', 'with', 'about', 'against', 'before', 'into', 'を通じて、中、前、後、上、下、先、上、下、中、外、上、「オフ」、「上」、「下」、「再び」、「さらに」、「その後」、「一度」、「ここ」、「そこ」、「いつ」、「どこで」、「なぜ」、「どのように」、「すべて」、「すべて」、「両方」、「それぞれ」、「少ない」、「もっと」、「ほとんど」、「その他」、「一部」、「そのような」、「いいえ」 、「も」、「ない」、「のみ」、「自分」、「同じ」、「そう」、「より」、「も」、「非常に」、「s」、「t」、「できる」、「 will', 'just', 'don', 'should', '今']'s', 't', 'can', 'will', 'just', 'don', 'should', 'now']'s', 't', 'can', 'will', 'just', 'don', 'should', 'now']
私が理解できないのは、なぜ「ない」という言葉が存在するのですか?文中の感情を判断するために必要ではないでしょうか。たとえば、次のような文です。
何が問題なのかわかりません。
ストップワードnot
が削除されると、文の意味がその反対に変わります ( I am sure what the problem is
)。その場合、これらのストップワードを使用しない場合に見逃している一連のルールはありますか?