問題タブ [nokogiri]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
xml - ノードの特定の位置に子を追加するにはどうすればよいですか?
HTML テキストと HTML 要素の 2 つの子を持つノードがあります。
この場合、HTML テキストは次のとおりです。
および HTML 要素:
次に、次のようなノードを作成します。
さて、上記のノードをメインノードに追加するには、次を使用します。
これにより、最後にスパン ノードが追加されます。span_node
をすべての子の前に置くにはどうすればよいですか?
xpath - のこぎりは、後/前のスタイルとスクリプトタグをスクラブします
上部にある既存のノードセットに大量の html を追加しようとしています。ほとんどの場合は機能しますが、スタイル タグとスクリプト タグのコンテンツがスクラブされています。これが私が意味することです:
しかし、これを表示しようとすると、次のようになります。
script タグと style タグの間のすべてをスクラブし、html コメントを完全に無視します。これを回避する方法はありますか?
ruby - nokogiriを使用してテーブルをループし、行をオブジェクトに変換する方法
nokogiriを使用してhtmlをループし、すべての行に対応するオブジェクトを作成したいと思います。データがオブジェクト変数を埋めるルートxpathを定義することはできますが、これらをオブジェクトとしてグループ化する方法がわかりません。
私のコードは以下の通りです。私はそれが機能しないことを知っていますが、それを機能させるためにどの方向に進むべきかわかりません。
「rubygems」が必要「nokogiri」が必要
doc = Nokogiri :: HTML.parse(<<-HTML_END) "LV1LV2LV3 MV1MV2MV3 NV1NV2NV3" HTML_END
class Post def initialize(v1、v2、v3)@ v1 = v1 @ v2 = v2 @ v3 = v3 end
終わり
class PostList def initialize @posts = Array.new end
終わり
list = PostList.new
親=doc.css('body')。first
行の内容を取得します
parent.xpath( "// div / table [@ class ='ipbtable'] / tr").each do | a_tag |
k1 = "x" k2 = "x" k3 = "x"
a_tag.xpath( "td [1]")。each do | x_tag |
x_tag.contentを置きます
終わり
list.append(Post.new(k1、k2、k3))
終わり
xml - nokogiri で xml ファイルを解析し、結果を新しいファイルに入れる方法は?
私はノコギリを始めたばかりで、質問があります。皆さんが私を助けてくれることを願っています:
- XML ファイルのセット (5 つのファイルとしましょう) を解析する必要があります。
- XPATH を使用して、City = "London" などの特定の値を持つ要素を検索します。
- ステップ 2 の前の XPATH クエリの結果を含む新しい XML ファイルを作成します。
ruby - 最も基本的な Nokogiri プログラムが失敗する -- ドキュメントの問題かバグか?
Nokogiri を試してみることにしました。次のプログラムをhttp://nokogiri.rubyforge.org/nokogiri/Nokogiri.htmlrequire 'rubygems'
から直接コピーしました (と定数のみを追加I_KNOW_I_AM_USING_AN_OLD_AND_BUGGY_VERSION_OF_LIBXML2
)。
結果は返されませんでした。しかし、私が変わったとき
に
プログラムは期待どおりに機能しました。唯一の違いは、行末に .read が追加されていることに注意してください。サンプルコードのほぼすべてのビットが .read. 皮肉なことに、ノコギリの開発者の 1 人による投稿 ( http://tenderlovemaking.com/2008/11/18/underpant-free-excitementで) が含まれていました。API の何かが変更されましたか? 私は何が欠けていますか?
Nokogiri 1.3.2 を使用しています。
ありがとうございました。
ruby - Nokogiri で XML ドキュメントを解析して返すにはどうすればよいですか?
ここにいくつかの奇妙さのサンプルがあります:
これを実行すると、次が返されます。
戻り値 XMLがなく、read
それがあると HTML ですか? Web ページは「XHTML トランジショナル」として定義されているため、最初は Nokogiri がストリームから OpenURI の「content-type」を読み取っていたに違いないと思っていましたが、次のように返されます'text/html'
。
これはサーバーが返すものです。だから、今、Nokogiri が 2 つの異なる値を返す理由を理解しようとしています。テキストを解析し、ヒューリスティックを使用してコンテンツが HTML か XML かを判断しているようには見えません。
そのページが指す ATOM フィードでも同じことが起こっています。
HTML かフィード (RSS または ATOM) かを事前に知らなくても、ページを解析して、それがどちらであるかを確実に判断できる必要があります。HTML または XML フィード ファイルの本文を解析するよう Nokogiri に依頼しましたが、一貫性のない結果が表示されます。
タイプを判別するテストをいくつか書けると思ったのですが、要素を見つけられない xpath に出くわしましたが、通常の検索は機能しています。
xpaths は XML で動作すると考えましたが、結果も信頼できるものではありません。
これらのテストはすべて私の Ubuntu ボックスで行われましたが、Macbook Pro でも同じ動作が見られました。何か間違ったことをしていることを知りたいのですが、一貫した結果が得られる解析と検索の例を見たことがありません。誰かが私のやり方の誤りを教えてくれますか?
html - ルビーとノコギリを使用して、HTMLコメントをマーカーとして使用してHTMLを解析する
これらの行で構成されるテーブルから情報を抽出するためにrubyを使用するにはどうすればよいですか?nokogiriを使用してコメントを検出することは可能ですか?
ruby - rubyとnokogiriを使用して、URLの一部に基づいてahrefを選択します
抽出したいahrefリンクを含むドキュメントがあります。必要なリンクは、リンク先のURLの一部で識別できます。私が破棄したい同様のリンクが他にもあります。
必要なリンクのURLは次の形式です
http://www.xxxxxxxxxxxxxxxxxxx.com/index.php?showtopic=44&hl=
h1=を含むリンクを検索したい。これは可能ですか?
xml - Nokogiri ドキュメントを Ruby Hash に変換する
Nokogiri XML ドキュメントを Hash に変換する簡単な方法はありますか?
Rails のHash.from_xml
.
ruby-on-rails - のこぎりで[]を含むIDのタグを検索
私は次のようなhtml要素を持っています:
この要素をidで検索したいのですが、のこぎりが[]で混乱しているようです。私はしようとしています:
しかし、役に立たない。