HTML コンテンツを Jekyll のマークダウンに変換するために、クレイジーなエイリアン技術* を使用しました。
一部のファイルに無効な HTML が含まれていることに気付きました。膨大な数のファイルがあるため、人間が手動でそれらすべてをすばやく確認することはできません。
マークダウン コンテンツを無視して、無効な HTML を含むすべてのファイルをすばやく一覧表示する方法はありますか? おそらくWindowsアプリを使用していますか?
*アプリ
たとえば、 Pandocは、マークダウン入力に含まれる無効な html を通過するようです。 検証のために、Pandoc からの HTML 出力をHTML Tidyに渡します。何かのようなもの:
$ pandoc input.md | tidy