split()を使用する場合、正規表現を使用すると、すべての単語文字を保持できますが、保持しないなどの短縮形も保持されます。アポストロフィの両側に単語文字が含まれているものの、「tisまたはdogs」などの先頭または末尾のアポストラフィは削除されます。
私は持っています:
String [] words = line.split("[^\\w'+]+[\\w+('*?)\\w+]");
ただし、先頭と末尾の句読点は保持されます。
の入力'Tis the season, for the children's happiness'.
次の出力を生成します:Tis the season for the children's happiness
何かアドバイス?