これは二重の質問です。
1. 外字を暗示的に組み込むには?
2. 末尾の空の文字列を取り除くには?
IEnumerable<String> words = Regex.Split(input, "[^a-zA-Z0-9-]+");
上記は魅力のように機能しました。それからドイツ人がやって来て、彼らの言葉のいくつかが半分に分かれていると不平を言い始めました. これは、文字列にドットまたはアクセント付きの文字が含まれている場合に発生します。これに取り組む 1 つの方法は、パターンにさらに文字を追加することですが、フランス語、ポーランド語、および基本的に英語以外の言語 (ラテン文字のみが有効です) があります。
すべての文字と数字とダッシュをパターン化するより良い方法は何でしょうか?
別の弦で遊んだとき、最後に疑問符があると、最後の分割部分として空の弦が得られることにも気付きました。最後の要素が空の文字列であるかどうかを確認して、今すぐ切り取っています。
なぜ私はそれを取得し、どうすればそれを取り除くことができますか?