私の用語は少し外れているかもしれませんが、C# の文字列から非文字を削除しようとしているので、ダッシュ、アンパサンドなどを削除しますが、アクセント付きの文字や漢字などは保持します。私が SO で見たすべての C# の例には、このような正規表現がありnew Regex("[^a-zA-Z0-9 -]");
ますが、私のニーズは ASCII 文字を超えています。
string input = "I- +AM. 相关 AZURÉE& /30%";
string output = "I AM 相关 AZURÉE 30";