HTML コードをプレーン テキストに変換しますが、余分な改行やスペースがたくさんあります。それらを削除するにはどうすればよいですか?
16002 次
4 に答える
18
string new_string = Regex.Replace(orig_string, @"\s", "")
すべての空白を削除します
string new_string = Regex.Replace(orig_string, @"\s+", " ")
複数の空白を1つに折りたたむだけです
于 2011-02-11T20:10:30.223 に答える
16
私はあなたがしたいと仮定しています
- 2 つ以上の連続するスペースを見つけて、それらを 1 つのスペースに置き換えます。
- 2 つ以上の連続する改行を見つけて、それらを 1 つの改行に置き換えます。
それが正しければ、使用できます
resultString = Regex.Replace(subjectString, @"( |\r?\n)\1+", "$1");
これにより、空白の元の「タイプ」がそのまま保持され、Windows の行末も正しく保持されます。複数のタブを 1 つに「凝縮」したい場合は、
resultString = Regex.Replace(subjectString, @"( |\t|\r?\n)\1+", "$1");
改行とスペース (それぞれ任意の数) の文字列を 1 つの改行にまとめるには、次を使用します。
resultString = Regex.Replace(subjectString, @"(?:(?:\r?\n)+ +){2,}", @"\n");
于 2011-02-11T21:04:02.033 に答える
-2
Trim() を使用して、スペースと改行を削除できます。HTML ではスペースは重要ではないため、System.String クラスの Trim() メソッドを使用してスペースを省略できます。
于 2011-02-11T20:10:05.873 に答える