Scanner の . next() メソッドが句読点をどのように扱うか知っている人はいますか? これに対する答えはどこにも見つかりませんでした。テキスト ファイルから各単語を読み取るプログラムがありますが、「それは」、「彼らは」、「彼女は」などの部分をどのように処理するかわかりません。
ピリオドとコンマについては、それらは別の実体としてカウントされますか、それとも「her」のように出現する場合、単語の一部と見なされますか? か彼女、"?それが何をするかによって、「彼女」と「彼女」です。または「彼女」と「彼女」は、スキャナによって 2 つの異なる単語と見なされますか?
アポストロフィについては、考慮されますか、それとも単語を効果的に 2 つに分割しますか? たとえば、「they're」は「they」「'」「re」と認識されるのでしょうか、それとも「they're」と完全に認識されるのでしょうか?
この質問にはっきりと出くわしたことを願っています。