htmlファイルからテーブルデータを抽出するために、htmlアジリティパックを使用してhtmlファイルを解析しています。ただし、オプションの終了タグがない、またはオプションの開始タグがないhtmlファイルがいくつかあるため、htmlアジリティパックはそのhtmlページを適切に解析しません。そのhtmlファイルのコンテンツをメモ帳++で開くと次に、オプションTestFX-->TestFX HTML Tidy-->TiDy clean document
を使用して、コンテンツをこのように整理します。そして今、このファイルhtmlアジリティパックで解析すると、適切に解析されます。
notepad++でhtmlページを整理するのが最良のオプションです。
だから私にはわかりませんが、ユーザーは最初にメモ帳++でページを整理してから先に進むようにこれを行うことはできません。それではどうすればよいですか?
編集私はhtmltidypackを使用しましたが、場合によっては解析されないファイルがありますが、このページをnotepad++で整頓すると解析されます。