次の文字列のトークン化または単語の分割とノイズの除去を行うのに役立つJavaベースの言語ユーティリティがいくつかあるのではないかと思います
文字列の場合
Friday's meeting is wonderful
期待される結果は一連の単語になります
Friday meeting wonderful
と が削除された場所
そして文字列の場合
I went to the farmer's market
期待される結果は言葉になる
went farmer market
I、to、the、および が削除された場所