単語とすべての句読点を分離するために、大きな文字列を解析しようとしています。Java には、StringTokenizer クラスの次のコンストラクターがあります。
public StringTokenizer(String str, String delim, boolean returnDelims)
最後のパラメーターに注意してください。それが true の場合、各区切り文字もトークンとして返されます。
この Java 機能を模倣する Obj-C のクラスはありますか? 文字列を解析できましたが、その過程で区切り記号を失い、それらの区切り記号によって次に何をするかが決まります。
CFStringTokenizer リファレンスによると、「単語、文、および段落」にトークン化されます。それ以上の粒度が必要です。
助けに感謝します。