問題タブ [tidy]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - Tidyへの変換
PHP 5 Tidy クラスを使用して HTML をフォーマットしています。
スタイル属性が渡されたとき、クラス属性に変更されたときを除いて、すべて問題ありません。ドキュメントの本文のみをフォーマットしているため、ヘッドではなく、属性を読み取るためのクラスがヘッドに定義されていません。
Tidy のすべてのオプションを確認しましたが、この動作を停止する方法がわかりません。
ありがとう
java - JTidy Node.findBody()—使用方法は?
JTidyを使用してXHTMLDOM解析を実行しようとしていますが、これはかなり直感に反する作業のようです。特に、HTMLを解析する方法があります。
そして、そのノードの<body />を取得するには、
そのTagTableのインスタンスはどこで入手できますか?(コンストラクターは保護されており、それを製造する工場は見つかりませんでした。)
JTidy8.0-SNAPSHOTを使用しています。
c# - すべてのhtmlエスケープ文字を整理されたxhtml文字列に変換して、XmlDocumentにロードする方法は?
.net Web アプリケーションで、html を返すサードパーティの CMS API と通信します。これを整形式の xml に変換する必要があるため、.NET ラッパーを使用して HTML tidy を囲みます。これは素晴らしい DOM を生成しますが、 のような文字
が使用されると問題が発生します。
 
XmlDocument がそれを受け入れるように、それらをコード形式に変換する必要があります。
XHTML にする以外に、きちんとしたラッパーにこれ以上オプションを設定することはできません。文字列が返されたら、いくつかの魔法を行う必要がありますが、それは私自身のマッピングを使用した正規表現になると思いますか?
html - Perl でリッチ テキスト エディタから HTML を解析する最良の方法は何ですか?
不適切な HTML (Microsoft Word からコピーされたものなど) を取得して、適切にフォーマットされた HTMLに解析できる Perl モジュールはありますか? HTML::Tidyを見てきましたが、 CPAN でひどいレビューを受けています。基本的にコマンド ライン バージョンの tidy のラッパーであるカスタム レガシー モジュールがあります (HTML::Tidy とほとんど同じように見えます) が、ファイルをディスクに書き込んで読み込むので、パフォーマンスが大幅に向上する可能性があります。ペナルティ。確かに、Perl の優れたテキスト解析機能を使用すると、これを正しく行うためのより良い方法がありますか?
php - DOMDocument: 重複する要素 ID を無視する
一部のページ コンテンツ (Tidy を介して実行されていますが、これが問題の原因である場合は必要ありません) をDOMDocument
usingに入れてDOMDocument::loadHTML
います。
さまざまなエラーが発生しています。
ID x はエンティティ、行 X で既に定義されています
DOMDocument
重複する要素 ID を (または Tidy) で無視または削除する方法はありますDOMDocument
か?
ありがとう。:)
visual-studio - Delete files from disk that aren't in a Visual Studio project
Can anyone think of a way (perhaps using a PowerShell script or similar) where I can look for *.cs files that are on disk in the folder structure, but aren't included in a project file?
This has come about gradually over time with merging in Subversion etc. I'm looking for a way to clean up after myself, basically. :)
continuous-integration - Selenium に統合された xHTML マークアップ チェッカー
最近、継続的インテグレーション マシンで xHTML ソースの継続的なチェックを使用して、プロジェクトの品質を向上させる方法を考えました。
ほら、私たちにはプロジェクトがあります
http://sourceforge.net/projects/jtidy - jTidy JTidy は、HTML syntax checker
きれいなプリンターである HTML Tidy の Java ポートです。
コマンドライン インターフェイスを介して xHTML を検証できます。または、このツールは、すべてのソース コードが公開されているため、必要に応じて拡張できます。
assertTextPresent などのすべての Selenium 検証メソッドを上書きできるため、(現在の状態の HTML ソースを提供することによって) jTidy が呼び出され、エラーや警告が発生した場合は、継続的インテグレーション マシン ビルドに保存できます。ログ - プロジェクトに関連するすべてのユーザーがこの情報を見ることができます。
すべてのステップでこの呼び出しを統合するために、すべての Selenium メソッドを書き直すことはできませんが、(DOM 操作の後) 必要な場所でこの呼び出しを行うことができます。
はい、サイトに W3C マークアップ バリデーターを使用できますが、このバリデーターでページのソースの初期状態以外を検証する可能性はありません。ページの作成後、マークアップ エラー/警告を生成する可能性のある多数の DOM 操作が存在する可能性がありますが、このスキームですぐに見つけることができます。
継続的インテグレーションを使用する利点の 1 つは、コードからのフィードバックが迅速に得られることです。つまり、既存のコード ベースとどのように統合されるか、単体テストと機能テストに合格するかどうかをテストします。インスタント xHTML マークアップの検証ステータスなど、追加の有用な情報を入手してみませんか。問題の特定が早ければ早いほど、修正が容易になります。
このテーマについては、Google でまだ何も見つかりませんでした。そして知りたいのですが、このアイデアについてどう思いますか?
css - CSSをクリーンアップするためのツール?
サイトを公開する前に、未使用の CSS スタイルがたくさんあります。未使用の CSS クラス、div を検出する良いツールはありますか?
関連する質問:
php - 今まで見た中で最も醜い HTML のスクリーンスクレイピング
私は PHP と libtidy を使用して、歴史上最も恐ろしく不正な形式の HTML テーブルの使用法をスクリーニングしようとしています。このサイトは、いくつかの table、tr、td、font、または bold タグを閉じており、テーブル内にテーブルの多くの異なるレイヤーを一貫してネストしています。
スニペットの例:
魔法のように、すべてのブラウザーがこれを問題なくレンダリングするようです。PHPTidy はすべてをうまく処理していますが、テーブルは非常に深く、ほぼランダムにネストされているため、DOM XPath を使用してこれをトラバースするのは非常に困難です。
これを行うための他のアプローチについて、誰かに推奨事項はありますか?
POST-MORTEM : あまりにも多くのベルギー産の小麦ビールを飲みすぎてコードを汚した後、table、tr、および td を除くすべてのタグを strip_tags() で削除し、libtidy で実行することで素晴らしい結果が得られました。美しくフォーマットされ、非常に簡単に横断できるようになりました。パーサーに送信する前に、少しマッサージが必要だったようです。
firefox - tidy の FireFox バージョン
stdin で html 文字列を受け取り、DOM を表す整形式の xml 文字列を吐き出すバイナリを作成しようとしています。基本的に「整頓」されていますが、FireFox を使用しています。
FF ソース コードにフックする必要があるアイデアはありますか?