問題タブ [tidy]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - 今まで見た中で最も醜い HTML のスクリーンスクレイピング
私は PHP と libtidy を使用して、歴史上最も恐ろしく不正な形式の HTML テーブルの使用法をスクリーニングしようとしています。このサイトは、いくつかの table、tr、td、font、または bold タグを閉じており、テーブル内にテーブルの多くの異なるレイヤーを一貫してネストしています。
スニペットの例:
魔法のように、すべてのブラウザーがこれを問題なくレンダリングするようです。PHPTidy はすべてをうまく処理していますが、テーブルは非常に深く、ほぼランダムにネストされているため、DOM XPath を使用してこれをトラバースするのは非常に困難です。
これを行うための他のアプローチについて、誰かに推奨事項はありますか?
POST-MORTEM : あまりにも多くのベルギー産の小麦ビールを飲みすぎてコードを汚した後、table、tr、および td を除くすべてのタグを strip_tags() で削除し、libtidy で実行することで素晴らしい結果が得られました。美しくフォーマットされ、非常に簡単に横断できるようになりました。パーサーに送信する前に、少しマッサージが必要だったようです。
firefox - tidy の FireFox バージョン
stdin で html 文字列を受け取り、DOM を表す整形式の xml 文字列を吐き出すバイナリを作成しようとしています。基本的に「整頓」されていますが、FireFox を使用しています。
FF ソース コードにフックする必要があるアイデアはありますか?
php - Vim 内での PHP コードのフォーマット
現在、軽量 IDE として Vim を使用しています。NERDTree、bufexplorer、supertab、および ctags プラグインがあり、必要なほとんどすべてを実行できます。私にとって欠けている唯一の大きなものは、コードの自動フォーマットです。
インデントとコードの書式設定に一貫性がない厄介な PHP コードを使用しています。理想的には、書式設定するコードを強調表示し (ファイル全体でも問題ありません)、コマンドを実行して整理することができます。
Vimでこれを行うための良い解決策はありますか?
python - 美しいスープとuTidy
utidyの結果を Beautiful Soup に渡したいと思います。
実行すると、次のエラーが発生します。
BeautifulSoup が文字列を要求しているのに対し、utildy は XML ドキュメントを返します。clean_html をキャストする方法はありますか? それとも、私はそれを間違っているので、別のアプローチを取る必要がありますか?
php - PHP/HTML ページのクリーンアップ
php と html を含むファイルをクリーンアップする優れたツールを知っている人はいますか? 以前 Tidy を使用したことがありますが、php コードをそのままにしておくとうまくいきません。tidy にはさまざまな実装があることは知っていますが、特に html と php を含むページのチャンピオンを支配するツールはありますか?
html - Tidyは非標準のHTMLを提供します
私はTidyを使用して、HTMLファイルをクリーンアップしてHTML/XHTMLに準拠させています。ただし、出力には次のような非標準の属性値が含まれます。
また
(一重引用符を見てください)。厳密なXHTML出力を提供するようにTidyを構成するにはどうすればよいですか?前もって感謝します!
xml - 3.0とXMLTidyを比較するだけでなく、元の形式を保存する
私はBeyondCompare3.0を使用しており、XMLtidyとソートされた属性プラグインで整理されたXMLを使用しています。それは素晴らしいことであり、「整理された」XMLを表示したいのですが、マージを解決したら、元の形式(整理された形式ではない)で保存し直したいと思います。とにかくこれを行う方法はありますか?
たとえば、これら2つのXMLスニペットがある場合-
それらが整理され、属性がソートされていることを視覚的に確認したいので、変更/解決を行うことができます。たとえば、attribの値を5に変更して残りを保持することを決心した場合、ファイルを保存するときに、これを確認したい...
比較を超えて、ファイルを2番目の形式(整理された)で保存しているようです。
これを修正するにはどうすればよいですか?
よろしく...
java - 悪い間隔の問題を引き起こす整頓(JTidy)
JTidyを使用して、サックス処理用のHTMLをクリーンアップしています。この例に示すように、間隔の問題に関して多くの問題が発生しました。
HTML
「stackoverflow」を出力します
だが...
JTidyを投稿する
「スタックオーバーフロー」を出力します(新しいスペースに注意してください)
誰もがこれをより良く修正/処理するためのアドバイスがあります。私はすべてのTidy/JTidy設定を確認しましたが、この問題を説明するものは何もありません。