問題タブ [nokogiri]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
17265 参照

xml - ノードの特定の位置に子を追加するにはどうすればよいですか?

HTML テキストと HTML 要素の 2 つの子を持つノードがあります。

この場合、HTML テキストは次のとおりです。

および HTML 要素:

次に、次のようなノードを作成します。

さて、上記のノードをメインノードに追加するには、次を使用します。

これにより、最後にスパン ノードが追加されます。span_nodeをすべての子の前に置くにはどうすればよいですか?

0 投票する
1 に答える
691 参照

xpath - のこぎりは、後/前のスタイルとスクリプトタグをスクラブします

上部にある既存のノードセットに大量の html を追加しようとしています。ほとんどの場合は機能しますが、スタイル タグとスクリプト タグのコンテンツがスクラブされています。これが私が意味することです:

しかし、これを表示しようとすると、次のようになります。

script タグと style タグの間のすべてをスクラブし、html コメントを完全に無視します。これを回避する方法はありますか?

0 投票する
1 に答える
2699 参照

ruby - nokogiriを使用してテーブルをループし、行をオブジェクトに変換する方法

nokogiriを使用してhtmlをループし、すべての行に対応するオブジェクトを作成したいと思います。データがオブジェクト変数を埋めるルートxpathを定義することはできますが、これらをオブジェクトとしてグループ化する方法がわかりません。

私のコードは以下の通りです。私はそれが機能しないことを知っていますが、それを機能させるためにどの方向に進むべきかわかりません。

「rubygems」が必要「nokogiri」が必要

doc = Nokogiri :: HTML.parse(<<-HTML_END) "LV1LV2LV3 MV1MV2MV3 NV1NV2NV3" HTML_END

class Post def initialize(v1、v2、v3)@ v1 = v1 @ v2 = v2 @ v3 = v3 end

終わり

class PostList def initialize @posts = Array.new end

終わり

list = PostList.new

親=doc.css('body')。first

行の内容を取得します

parent.xpath( "// div / table [@ class ='ipbtable'] / tr").each do | a_tag |

k1 = "x" k2 = "x" k3 = "x"

a_tag.xpath( "td [1]")。each do | x_tag |

x_tag.contentを置きます

終わり

list.append(Post.new(k1、k2、k3))

終わり

0 投票する
1 に答える
11627 参照

xml - nokogiri で xml ファイルを解析し、結果を新しいファイルに入れる方法は?

私はノコギリを始めたばかりで、質問があります。皆さんが私を助けてくれることを願っています:

  1. XML ファイルのセット (5 つのファイルとしましょう) を解析する必要があります。
  2. XPATH を使用して、City = "London" などの特定の値を持つ要素を検索します。
  3. ステップ 2 の前の XPATH クエリの結果を含む新しい XML ファイルを作成します。
0 投票する
4 に答える
1091 参照

ruby - 最も基本的な Nokogiri プログラムが失敗する -- ドキュメントの問題かバグか?

Nokogiri を試してみることにしました。次のプログラムをhttp://nokogiri.rubyforge.org/nokogiri/Nokogiri.htmlrequire 'rubygems'から直接コピーしました (と定数のみを追加I_KNOW_I_AM_USING_AN_OLD_AND_BUGGY_VERSION_OF_LIBXML2)。

結果は返されませんでした。しかし、私が変わったとき

プログラムは期待どおりに機能しました。唯一の違いは、行末に .read が追加されていることに注意してください。サンプルコードのほぼすべてのビットが .read. 皮肉なことに、ノコギリの開発者の 1 人による投稿 ( http://tenderlovemaking.com/2008/11/18/underpant-free-excitementで) が含まれていました。API の何かが変更されましたか? 私は何が欠けていますか?

Nokogiri 1.3.2 を使用しています。

ありがとうございました。

0 投票する
2 に答える
5828 参照

ruby - Nokogiri で XML ドキュメントを解析して返すにはどうすればよいですか?

ここにいくつかの奇妙さのサンプルがあります:

これを実行すると、次が返されます。

戻り値 XMLがなく、readそれがあると HTML ですか? Web ページは「XHTML トランジショナル」として定義されているため、最初は Nokogiri がストリームから OpenURI の「content-type」を読み取っていたに違いないと思っていましたが、次のように返されます'text/html'

これはサーバーが返すものです。だから、今、Nokogiri が 2 つの異なる値を返す理由を理解しようとしています。テキストを解析し、ヒューリスティックを使用してコンテンツが HTML か XML かを判断しているようには見えません。

そのページが指す ATOM フィードでも同じことが起こっています。

HTML かフィード (RSS または ATOM) かを事前に知らなくても、ページを解析して、それがどちらであるかを確実に判断できる必要があります。HTML または XML フィード ファイルの本文を解析するよう Nokogiri に依頼しましたが、一貫性のない結果が表示されます。

タイプを判別するテストをいくつか書けると思ったのですが、要素を見つけられない xpath に出くわしましたが、通常の検索は機能しています。

xpaths は XML で動作すると考えましたが、結果も信頼できるものではありません。

これらのテストはすべて私の Ubuntu ボックスで行われましたが、Macbook Pro でも同じ動作が見られました。何か間違ったことをしていることを知りたいのですが、一貫した結果が得られる解析と検索の例を見たことがありません。誰かが私のやり方の誤りを教えてくれますか?

0 投票する
2 に答える
2803 参照

html - ルビーとノコギリを使用して、HTMLコメントをマーカーとして使用してHTMLを解析する

これらの行で構成されるテーブルから情報を抽出するためにrubyを使用するにはどうすればよいですか?nokogiriを使用してコメントを検出することは可能ですか?

0 投票する
1 に答える
275 参照

ruby - rubyとnokogiriを使用して、URLの一部に基づいてahrefを選択します

抽出したいahrefリンクを含むドキュメントがあります。必要なリンクは、リンク先のURLの一部で識別できます。私が破棄したい同様のリンクが他にもあります。

必要なリンクのURLは次の形式です

http://www.xxxxxxxxxxxxxxxxxxx.com/index.php?showtopic=44&hl=

h1=を含むリンクを検索したい。これは可能ですか?

0 投票する
8 に答える
47356 参照

xml - Nokogiri ドキュメントを Ruby Hash に変換する

Nokogiri XML ドキュメントを Hash に変換する簡単な方法はありますか?

Rails のHash.from_xml.

0 投票する
3 に答える
6449 参照

ruby-on-rails - のこぎりで[]を含むIDのタグを検索

私は次のようなhtml要素を持っています:

この要素をidで検索したいのですが、のこぎりが[]で混乱しているようです。私はしようとしています:

しかし、役に立たない。