“html-parser”の関連問題_Stack Overflow日本語サイト

0 投票する

3 に答える

2485 参照

css - Ruby で外部 CSS をインライン CSS に変換するツールは?

私は GoogleDocs をいじっていますが、非常に原始的な CSS サポートがあります。MSWord .doc または HTML ファイルをアップロードして HTML としてエクスポートすると、すべてのスタイルがインラインで適用されます。HTML ファイルにスタイルブロックがありますが、HTML ファイルを Google ドキュメントにアップロードすると、インライン以外のスタイルは適用されません。

そこで「これには ruby ツールがあるのかな」と思っていました。CSSを取得してHTMLノードに解析させるために使用できるものはありますか?おそらくnokogiriプラグインですか?

2010-02-16T11:31:18.103

0 投票する

2 に答える

2312 参照

perl - Perl 5.6 に HTML-Parser-3.64 をインストールするにはどうすればよいですか?

HTML-Parser-3.64 をインストールしようとしていますが、実行中に次のレポートが表示されますmake test。

Perl バージョン 5.6.1 を使用しています。および Solaris 8 のパーサーの 3.64 バージョン。インターネット上の別の人がhttp://www.cpantesters.org/cpan/report/6653478で報告した同様のエラーを見ました。しかし、それに対する返信や解決策は見られませんでした。

perl html-parser

2010-02-17T19:02:33.013

0 投票する

4 に答える

33264 参照

ruby - RubyでHTMLドキュメントを解析する方法は？

PHPのDOMDocumentクラスと同様に、HTMLドキュメントからノード要素の値を解析して取得するためのクラス（つまり、コアRUBY）はありますか。

ruby html-parser

2010-03-31T17:01:28.363

0 投票する

1 に答える

3110 参照

iphone - C/Objective-c/iPhone 向けのソリューションのような「html アジリティパック」

HTML Agility Pack のような、Objective-C/C 用の強力な HTML パーサーとマニピュレーターが必要です。

誰かが最適な解決策を教えてもらえますか? 1 つの解決策は libxml2 ですが、これは最適とは言えません。

前もって感謝します！

iphone c objective-c html-agility-pack html-parser

2010-04-26T09:06:34.317

0 投票する

1 に答える

312 参照

java - htmlを解析する方法

Java HtmlParserをダウンロードしましたが、API を使用して HTML データを抽出する方法がわかりません。私がそれに取り組むことができるように、いくつかの例を挙げてもらえますか?

java html-parser

2010-08-05T14:58:25.517

0 投票する

1 に答える

7190 参照

perl - カスタムタグ（Perlインタープリター）を使用してHTMLドキュメントを解析するための単純なPerlスクリプトは何ですか？

これが私がやっていることです。カスタム拡張子（.cpm）で終わるドキュメント用のperlインタープリターを作成しています。私は周りを見回して見つけました

HTML::Parserがその方法のようです。私が求めているのは、特別なタグを持つドキュメントを解析するための簡単なチュートリアルです。たとえば、HTMLドキュメントを解析する方法を示すものが必要ですが、<putinbold>が検出されると、それが。に置き換えられ<b>ます。

私が欲しいものの例-

<html>
This is HTML talking
<liamslanguage>say "This is Liams language speaking"</liamslanguage>
</html>

perl html-parser

2010-12-15T00:37:58.667

0 投票する

2 に答える

1111 参照

java - html タグを保持する html 検索と置換

HTML タグを保持するテキストを検索および置換できる Java ベースの HTML パーサーを探しています。この質問は以前にここで尋ねられましたが、答えが的を射ていないようです。私がダウンロードして簡単なプログラムを書いて、それらが仕事をすることができるかどうかを確認する html パーサーはほとんどありません。これらには、jsoup、Jericho、Java HTML パーサーなどが含まれます。これらは検索を行うことができますが、html タグを保持するテキストを置き換える場合、それを行う方法はありません。

これらの投稿の完全なスレッドを読みました。

HTMLタグ/構造を維持しながらHTML内のテキストを検索/置換する方法

サーバー側でのhtml検索と置換

そのようなパーサーが現在存在しない場合、それを実装するための最良の方法は何ですか? すでにこのようなことを行っている場合は、コードを共有できますか?

java html-parser

2011-01-19T22:42:15.250

0 投票する

2 に答える

846 参照

c# - HTML パーサーの検証タグ

生成されたhtmlのエラーを識別する機能を備えたhtml解析が必要です。タグが閉じられていない場合は、タグを閉じて有効なhtmlを返します。

詳細: データベースからデータを取得し、その記録を破って Web サイトに部分的な詳細を表示し、[詳細] ボタンをクリックして完全なコンテンツを表示します。文字列を分割した後、検証します。

私はすでに Html Agility Pack を使用していますが、使用するのは初めてです。このライブラリが問題を解決する場合は、その方法 (チュートリアル) を案内するか、別のライブラリを提案してください。

c#html html-parser

2011-01-28T12:12:38.670

0 投票する

2 に答える

95 参照

xml - xpathで私を助けてください

重複の可能性:
xpath を知っている場合は、助けてください。

こんにちは、これがhtmlコードです

そこで、Google と Yahoo! というテキストが必要です。

どうすればそれを手に入れることができますか

ここに私が書いたものがあります

何が起こっているのかわかりませんが、何も表示されません...

ありがとう

xml xpath html-parser

2011-03-13T05:05:35.057

0 投票する

1 に答える

622 参照

java - org.htmlparser.Parser を使用して URL を解析していますが、外部 URL で失敗し、接続が拒否されました: 接続エラーが発生します

私は org.htmlparser.Parser を使用して URL を解析しています。ネットワーク内のすべての内部 URL に対して正常に機能します。しかし、外部 URL を開こうとすると、

スレッド「メイン」org.htmlparser.util.ParserException の例外: 接続が拒否されました: 接続; java.net.ConnectException: 接続が拒否されました: 接続

この行は失敗しています -

パーサー p = 新しいパーサー("http://www.google.com");

プロキシを使用してブラウザで外部 URL を開くことができます。したがって、コードでも Authenticator クラスを使用してプロキシ認証を行っていますが、機能していません。

java html-parsing html-parser

2011-04-29T17:16:38.367

問題タブ [html-parser]

Reference