プログラムのインデックスを作成したいのですが、最も重要なステップの 1 つはテキストを正規化することです。たとえば、"[(Mac Pro @apple)]" を "macproapple" に変換する必要があります。この場合、空白、句読点 ([()])、および特殊文字 (@) をフィルター処理します。私のコードは次のようなものです:
StringBuilder sb = new StringBuilder(text);
sb = filterPunctuations(sb);
sb = filterSpecialChars(sb);
sb = filterBlankSpace(sb);
sb = toLower(sb);
これにより多くの String オブジェクトが生成されるため、StringBuilder を使用することにしました。しかし、StringBuffer でそれを行う方法がわかりません。誰にもいくつかの提案がありますか?漢字も扱う必要があります。