問題タブ [html-parser]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
css - Ruby で外部 CSS をインライン CSS に変換するツールは?
私は GoogleDocs をいじっていますが、非常に原始的な CSS サポートがあります。MSWord .doc または HTML ファイルをアップロードして HTML としてエクスポートすると、すべてのスタイルがインラインで適用されます。HTML ファイルにスタイル ブロックがありますが、HTML ファイルを Google ドキュメントにアップロードすると、インライン以外のスタイルは適用されません。
そこで「これには ruby ツールがあるのかな」と思っていました。CSSを取得してHTMLノードに解析させるために使用できるものはありますか?おそらくnokogiriプラグインですか?
perl - Perl 5.6 に HTML-Parser-3.64 をインストールするにはどうすればよいですか?
HTML-Parser-3.64 をインストールしようとしていますが、実行中に次のレポートが表示されますmake test
。
Perl バージョン 5.6.1 を使用しています。および Solaris 8 のパーサーの 3.64 バージョン。インターネット上の別の人がhttp://www.cpantesters.org/cpan/report/6653478で報告した同様のエラーを見ました。しかし、それに対する返信や解決策は見られませんでした。
ruby - RubyでHTMLドキュメントを解析する方法は?
PHPのDOMDocumentクラスと同様に、HTMLドキュメントからノード要素の値を解析して取得するためのクラス(つまり、コアRUBY)はありますか。
iphone - C/Objective-c/iPhone 向けのソリューションのような「html アジリティ パック」
HTML Agility Pack のような、Objective-C/C 用の強力な HTML パーサーとマニピュレーターが必要です。
誰かが最適な解決策を教えてもらえますか? 1 つの解決策は libxml2 ですが、これは最適とは言えません。
前もって感謝します!
java - htmlを解析する方法
Java HtmlParserをダウンロードしましたが、API を使用して HTML データを抽出する方法がわかりません。私がそれに取り組むことができるように、いくつかの例を挙げてもらえますか?
perl - カスタムタグ(Perlインタープリター)を使用してHTMLドキュメントを解析するための単純なPerlスクリプトは何ですか?
これが私がやっていることです。カスタム拡張子(.cpm)で終わるドキュメント用のperlインタープリターを作成しています。私は周りを見回して見つけました
- http://perlmeme.org/tutorials/html_parser.html
- https://metacpan.org/pod/HTML::TokeParser::Simple
- http://www.justskins.com/forums/html-parser-8489.html
HTML::Parserがその方法のようです。私が求めているのは、特別なタグを持つドキュメントを解析するための簡単なチュートリアルです。たとえば、HTMLドキュメントを解析する方法を示すものが必要ですが、<putinbold>
が検出されると、それが。に置き換えられ<b>
ます。
私が欲しいものの例-
<html>
This is HTML talking
<liamslanguage>say "This is Liams language speaking"</liamslanguage>
</html>
java - html タグを保持する html 検索と置換
HTML タグを保持するテキストを検索および置換できる Java ベースの HTML パーサーを探しています。この質問は以前にここで尋ねられましたが、答えが的を射ていないようです。私がダウンロードして簡単なプログラムを書いて、それらが仕事をすることができるかどうかを確認する html パーサーはほとんどありません。これらには、jsoup、Jericho、Java HTML パーサーなどが含まれます。これらは検索を行うことができますが、html タグを保持するテキストを置き換える場合、それを行う方法はありません。
これらの投稿の完全なスレッドを読みました。
HTMLタグ/構造を維持しながらHTML内のテキストを検索/置換する方法
そのようなパーサーが現在存在しない場合、それを実装するための最良の方法は何ですか? すでにこのようなことを行っている場合は、コードを共有できますか?
c# - HTML パーサーの検証タグ
生成されたhtmlのエラーを識別する機能を備えたhtml解析が必要です。タグが閉じられていない場合は、タグを閉じて有効なhtmlを返します。
詳細: データベースからデータを取得し、その記録を破って Web サイトに部分的な詳細を表示し、[詳細] ボタンをクリックして完全なコンテンツを表示します。文字列を分割した後、検証します。
私はすでに Html Agility Pack を使用していますが、使用するのは初めてです。このライブラリが問題を解決する場合は、その方法 (チュートリアル) を案内するか、別のライブラリを提案してください。
xml - xpathで私を助けてください
重複の可能性:
xpath を知っている場合は、助けてください。
こんにちは、これがhtmlコードです
そこで、Google と Yahoo! というテキストが必要です。
どうすればそれを手に入れることができますか
ここに私が書いたものがあります
何が起こっているのかわかりませんが、何も表示されません...
ありがとう
java - org.htmlparser.Parser を使用して URL を解析していますが、外部 URL で失敗し、接続が拒否されました: 接続エラーが発生します
私は org.htmlparser.Parser を使用して URL を解析しています。ネットワーク内のすべての内部 URL に対して正常に機能します。しかし、外部 URL を開こうとすると、
スレッド「メイン」org.htmlparser.util.ParserException の例外: 接続が拒否されました: 接続; java.net.ConnectException: 接続が拒否されました: 接続
この行は失敗しています -
パーサー p = 新しいパーサー("http://www.google.com");
プロキシを使用してブラウザで外部 URL を開くことができます。したがって、コードでも Authenticator クラスを使用してプロキシ認証を行っていますが、機能していません。