私はいくつかのテキスト処理を行っており、すべてのテキストを小文字に変換する必要がありますが、テキストはフランス語であり、「È」が「è」などに変換されるように、すべての発音記号を維持する必要があります。それはまったく役に立ちます。実際には、最終出力をテキストとして必要とせず、一意の文字ごとに識別子 (例: 数字) だけを必要とします (「e」と「è」は異なる文字です)。助言がありますか?
私はいくつかのテキスト処理を行っており、すべてのテキストを小文字に変換する必要がありますが、テキストはフランス語であり、「È」が「è」などに変換されるように、すべての発音記号を維持する必要があります。それはまったく役に立ちます。実際には、最終出力をテキストとして必要とせず、一意の文字ごとに識別子 (例: 数字) だけを必要とします (「e」と「è」は異なる文字です)。助言がありますか?