2

事実上判読できない密にフォーマットされた HTML の問題に対処する必要があるため、この HTML を管理している .NET アプリケーション内でライブラリを「きれいに印刷」、フォーマット、美化、または呼び出したいものは何でもしたいと考えています。

現時点では、それを Visual Studio 2012 にコピー アンド ペーストしてフォーマットし、アプリケーションにペーストし直していますが、これは少し面倒です。

また、問題を修正したときに、プロセスを効果的に逆にしてすべての空白を取り除くことができれば便利です。

ちなみに、HTML のフォーマットを変更すると予期しない結果が生じることがあることは承知していますが (IE を見ています)、それは我慢できます。

4

1 に答える 1

4

Html Tidy for .NET/Monoをチェックしてください

プロジェクトページから:

TidyManaged

これは、オープンソースのクロスプラットフォームTidyライブラリ用のマネージド.NET / Monoラッパーであり、元々DaveRaggettによって作成されたHTML/ XHTML/XMLマークアップパーサーおよびクリーナーです。

そして使用例:

using System;
using TidyManaged;

public class Test
{
  public static void Main(string[] args)
  {
    using (Document doc = Document.FromString("<hTml><title>test</tootle><body>asd</body>"))
    {
      doc.ShowWarnings = false;
      doc.Quiet = true;
      doc.OutputXhtml = true;
      doc.CleanAndRepair();
      string parsed = doc.Save();
      Console.WriteLine(parsed);
    }
  }
}

それはあなたのニーズを完全に満たすはずのようです。

于 2013-02-27T19:46:05.553 に答える