HTMLを削除することで変更されるデータテーブルがあります。htmlストリップ中に、、またはが検出された場合、<br>
それら<p>
は。<li>
に置き換えられSystem.Environment.NewLine
ます。htmlストリッププロセスのインスタンスをテキストファイルに記録していますが、ログでフォーマットが正常に表示されます(すべてのCRLFが保持されます)。ただし、データテーブルでupdateメソッドが呼び出され、データがデータベースに送信されると、CRLF文字はすべて失われます。
コードスニペット:
public static class HtmlStripper
{
static Regex _htmlRegex = new Regex("<.*?>", RegexOptions.Compiled);
static Regex _liRegex = new Regex("<li>", RegexOptions.Compiled);
static Regex _brRegex = new Regex("<(br)?(BR)?\\s?/?>\\s*", RegexOptions.Compiled);
static Regex _pRegex = new Regex("</?[phPH].*?>\\s*", RegexOptions.Compiled);
public static string StripTagsRegexCompiled(string source)
{
string noPorH = _pRegex.Replace(source, System.Environment.NewLine);
string noBr = _brRegex.Replace(noPorH, System.Environment.NewLine);
string noLi = _liRegex.Replace(noBr, System.Environment.NewLine + "t- ");
return _htmlRegex.Replace(noLi, string.Empty);
}
}