問題タブ [htmltidy]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
xslt - 重複するxmlヘッダーを削除します
html Tidyは、何らかの理由でこれを出力として提供します。
したがって、2つのxmlヘッダーがあり、タイプが間違っています(UTF-8ではありません)。2番目のヘッダーを削除してUTF-8に変更し、XSLでDOCTYPEを削除する方法はありますか?
php - HTML Tidy(PHP)でノーブレークスペースを維持するにはどうすればよいですか?
tidy_repair_string()
空の要素から改行しないスペースが削除され、テーブルが折りたたまれていることに気づきました。基本的に私は入れました:
<td> </td>
そしてHTMLTidyはそれらを次のように取り除きます:
これはUnicodeの破損である場合とそうでない場合がありますが、どちらにしても崩壊します。
私が見た唯一の関連オプションは「quote-nbsp」ですが、そうではないようです。とにかくデフォルトでオンになると思います。
ノーブレークスペースを維持するにはどうすればよいですか?
html - HTML 整頓、それらのコメントを移動しないでください!
私は html-tidy を使用していましたが、いくつかのコメントがドキュメントの先頭からルートに移動されました。とにかくこの動作を回避する方法はありますか?
(私はいくつかの本当に悪いマークアップをxhtmlの苦情コードに変えようとしています)ああ、さらに、コメントを使用してHTML内にデータを配置する、非常に非標準的な、社内で開発されたセミサーバーサイドスクリプト言語を使用します... 完全に変更したいのですが... 雇用主は...
問題は次のとおりです。
整頓前:
整頓後:
php - 今まで見た中で最も醜い HTML のスクリーンスクレイピング
私は PHP と libtidy を使用して、歴史上最も恐ろしく不正な形式の HTML テーブルの使用法をスクリーニングしようとしています。このサイトは、いくつかの table、tr、td、font、または bold タグを閉じており、テーブル内にテーブルの多くの異なるレイヤーを一貫してネストしています。
スニペットの例:
魔法のように、すべてのブラウザーがこれを問題なくレンダリングするようです。PHPTidy はすべてをうまく処理していますが、テーブルは非常に深く、ほぼランダムにネストされているため、DOM XPath を使用してこれをトラバースするのは非常に困難です。
これを行うための他のアプローチについて、誰かに推奨事項はありますか?
POST-MORTEM : あまりにも多くのベルギー産の小麦ビールを飲みすぎてコードを汚した後、table、tr、および td を除くすべてのタグを strip_tags() で削除し、libtidy で実行することで素晴らしい結果が得られました。美しくフォーマットされ、非常に簡単に横断できるようになりました。パーサーに送信する前に、少しマッサージが必要だったようです。
htmltidy - HTML Tidy が終了タグを削除しないようにするにはどうすればよいですか?
現在、HTML Tidy は空の HTML タグを変更し、それらを 1 つに結合します。たとえば、次のようになります。
になる:
これは、HTML の「ヘッド」に JavaScript ファイルを含めることが、この終了タグを開始タグとは別に明示的に必要とする一部のブラウザーで機能しないためです。
Tidy がこれらの終了タグを削除しないようにするにはどうすればよいですか?
c# - C#から.DLLを呼び出す奇妙な問題
C#からHtmlTidyライブラリdllを呼び出そうとしています。ネット上に浮かんでいるいくつかの例がありますが、決定的なものは何もありません...そして私は問題の終わりがありません。問題はp/invoke宣言にあると確信しています...しかし、どこが間違っているのかがわかっている場合は、問題が発生します。
libtidy.dllをhttp://www.paehl.com/open_source/?HTML_Tidy_for_Windowsから入手しました。これは現在のバージョンのようです。
これが私が抱えている問題を示すコンソールアプリです:
全体として、私は少し困惑しています。どんな助けでもいただければ幸いです!