問題タブ [html-parser]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
2485 参照

css - Ruby で外部 CSS をインライン CSS に変換するツールは?

私は GoogleDocs をいじっていますが、非常に原始的な CSS サポートがあります。MSWord .doc または HTML ファイルをアップロードして HTML としてエクスポートすると、すべてのスタイルがインラインで適用されます。HTML ファイルにスタイル ブロックがありますが、HTML ファイルを Google ドキュメントにアップロードすると、インライン以外のスタイルは適用されません。

そこで「これには ruby​​ ツールがあるのか​​な」と思っていました。CSSを取得してHTMLノードに解析させるために使用できるものはありますか?おそらくnokogiriプラグインですか?

0 投票する
2 に答える
2312 参照

perl - Perl 5.6 に HTML-Parser-3.64 をインストールするにはどうすればよいですか?

HTML-Parser-3.64 をインストールしようとしていますが、実行中に次のレポートが表示されますmake test

Perl バージョン 5.6.1 を使用しています。および Solaris 8 のパーサーの 3.64 バージョン。インターネット上の別の人がhttp://www.cpantesters.org/cpan/report/6653478で報告した同様のエラーを見ました。しかし、それに対する返信や解決策は見られませんでした。

0 投票する
4 に答える
33264 参照

ruby - RubyでHTMLドキュメントを解析する方法は?

PHPのDOMDocumentクラスと同様に、HTMLドキュメントからノード要素の値を解析して取得するためのクラス(つまり、コアRUBY)はありますか。

0 投票する
1 に答える
3110 参照

iphone - C/Objective-c/iPhone 向けのソリューションのような「html アジリティ パック」

HTML Agility Pack のような、Objective-C/C 用の強力な HTML パーサーとマニピュレーターが必要です。

誰かが最適な解決策を教えてもらえますか? 1 つの解決策は libxml2 ですが、これは最適とは言えません。

前もって感謝します!

0 投票する
1 に答える
312 参照

java - htmlを解析する方法

Java HtmlParserをダウンロードしましたが、API を使用して HTML データを抽出する方法がわかりません。私がそれに取り組むことができるように、いくつかの例を挙げてもらえますか?

0 投票する
1 に答える
7190 参照

perl - カスタムタグ(Perlインタープリター)を使用してHTMLドキュメントを解析するための単純なPerlスクリプトは何ですか?

これが私がやっていることです。カスタム拡張子(.cpm)で終わるドキュメント用のperlインタープリターを作成しています。私は周りを見回して見つけました

HTML::Parserがその方法のようです。私が求めているのは、特別なタグを持つドキュメントを解析するための簡単なチュートリアルです。たとえば、HTMLドキュメントを解析する方法を示すものが必要ですが、<putinbold>が検出されると、それが。に置き換えられ<b>ます。

私が欲しいものの例-

<html>
This is HTML talking
<liamslanguage>say "This is Liams language speaking"</liamslanguage>
</html>

0 投票する
2 に答える
1111 参照

java - html タグを保持する html 検索と置換

HTML タグを保持するテキストを検索および置換できる Java ベースの HTML パーサーを探しています。この質問は以前にここで尋ねられましたが、答えが的を射ていないようです。私がダウンロードして簡単なプログラムを書いて、それらが仕事をすることができるかどうかを確認する html パーサーはほとんどありません。これらには、jsoup、Jericho、Java HTML パーサーなどが含まれます。これらは検索を行うことができますが、html タグを保持するテキストを置き換える場合、それを行う方法はありません。

これらの投稿の完全なスレッドを読みました。

HTMLタグ/構造を維持しながらHTML内のテキストを検索/置換する方法

サーバー側でのhtml検索と置換

そのようなパーサーが現在存在しない場合、それを実装するための最良の方法は何ですか? すでにこのようなことを行っている場合は、コードを共有できますか?

0 投票する
2 に答える
846 参照

c# - HTML パーサーの検証タグ

生成されたhtmlのエラーを識別する機能を備えたhtml解析が必要です。タグが閉じられていない場合は、タグを閉じて有効なhtmlを返します。

詳細: データベースからデータを取得し、その記録を破って Web サイトに部分的な詳細を表示し、[詳細] ボタンをクリックして完全なコンテンツを表示します。文字列を分割した後、検証します。

私はすでに Html Agility Pack を使用していますが、使用するのは初めてです。このライブラリが問題を解決する場合は、その方法 (チュートリアル) を案内するか、別のライブラリを提案してください。

0 投票する
2 に答える
95 参照

xml - xpathで私を助けてください

重複の可能性:
xpath を知っている場合は、助けてください。

こんにちは、これがhtmlコードです

そこで、Google と Yahoo! というテキストが必要です。

どうすればそれを手に入れることができますか

ここに私が書いたものがあります

何が起こっているのかわかりませんが、何も表示されません...

ありがとう

0 投票する
1 に答える
622 参照

java - org.htmlparser.Parser を使用して URL を解析していますが、外部 URL で失敗し、接続が拒否されました: 接続エラーが発生します

私は org.htmlparser.Parser を使用して URL を解析しています。ネットワーク内のすべての内部 URL に対して正常に機能します。しかし、外部 URL を開こうとすると、

スレッド「メイン」org.htmlparser.util.ParserException の例外: 接続が拒否されました: 接続; java.net.ConnectException: 接続が拒否されました: 接続

この行は失敗しています -

パーサー p = 新しいパーサー("http://www.google.com");

プロキシを使用してブラウザで外部 URL を開くことができます。したがって、コードでも Authenticator クラスを使用してプロキシ認証を行っていますが、機能していません。