問題タブ [nokogiri]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
xml - Nokogiriノードの削除後に空白行を削除するためのより良い方法
たぶんこれはつまらないですが、私は尋ねなければなりません。
Nokogiriを使用してXMLを解析し、特定のタグを削除して、元のファイルに結果を上書きしています。を使用.remove
すると、XMLに空白行が残ります。私は現在、空白行を取り除くために正規表現を使用しています。使用すべき組み込みのノコギリメソッドはありますか?
これが私が持っているものです:
html - nokogiri: xml から html
単純な変換を行いたいだけです (ほとんどは検索と置換だけです) が、適切な場所に配置するだけで問題が発生しています。リンクがずれたり、コンテンツが重複したりしてしまいます。私はxmlをトラバースしようとして何かばかげたことをしていると確信しています:)
私は試しています:
の上:
作成するには:
私はこれを機能させるためにあらゆる種類のことを試みてきました.基本的なhtml構造は問題ありませんが、段落の子は混乱しています-どんな助けでも大歓迎です. よろしく、リッチー
ruby - Rubyスクリプトのメモリ消費率が上がり続けています...これを防ぐ方法はありますか?
非常に長い一連のループである Ruby スクリプトを実行すると。ループごとに、ランダムな html ファイルが nokogiri を介して解析されます。
top は、メモリ消費率が数秒ごとに CPU 使用率とともに 0.1 ずつ増加していることを示しています。
最終的に「メモリ不足」が原因で ruby スクリプトがクラッシュする
最新に更新:
ruby - nokogiri:無効な xpath?
これは機能せず、無効な xpath について文句を言います。
ただし、出力文字列をコピーして貼り付ける
問題なく動作します!!!
ここで何が起きてるの ?
ruby - のこぎり doc.xpath() の問題
多くのWebページをループして、以下のような単純なものを呼び出すとき
メモリ不足のためにスクリプトが終了するまで、メモリ消費量が継続的に増加することがわかりました。
doc.xpath ビットを削除すると、上記のエラーは発生しません。
ruby - JrubyとRubyでnokogiriを実行する
CPUとメモリの使用量に驚くべき違いがありました。次のnokogiriスクリプトを実行すると、ガベージコレクションが発生していないようです。
Jrubyで実行すると、CPU消費量は10を超え、メモリ消費量の割合は時間とともに増加し(2から20まで)、最終的に「メモリが不足しています」と表示されます。
Rubyで実行すると、CPU消費量が2を超えることはなく、メモリ消費量の%は0.2で一定です。
なぜこのような大きな違いがあるのか、クラッシュするまでメモリ消費量が着実に増加しているのはなぜですか。
Rubyで実行すると、CPU使用率がはるかに低くなり、メモリ消費量が常に非常に少なくなります。
html - Nokogiri::XML::Builder を使用してエスケープされていないアンパサンドを HTML に追加する方法
ノコギリのXMLビルダを使って、HTMLに箇条書き「・」のようなものを追加したいのですが、すべてエスケープされています。どうすれば漏れないようにできますか?
結果を次のようにしたいと思います。
それよりも:
私はちょうどこれをやっています:
私は何が欠けていますか?
ruby - nokogiri-javaをインストールせずにjrubyにnokogiriをロードすることは可能ですか?
次のnokogiriスクリプトを実行する方法が必要です
parseit()
jruby の main.rb の下で実行中に を呼び出します
もちろん、問題は、nokogiri-java経由'nokogiri'
でインストールしていないため、jrubyが見つからないことですjruby -S gem install nokogiri
その理由は、Jruby で実行している nokogiri にバグが見つかったため、Jruby ではなく Ruby にのみ nokogiri をインストールしました。はparser.rb
Ruby だけで完全に動作します。
したがって、私の目的は、Jruby に nokogiri をインストールせずに parseit() を実行できるようにすることです!
ruby - RubyでXMLノードのXPathを印刷する最速/ワンライナーの方法は?
Nokogiriを使用してRubyで現在のノードのxpath、または単に「path / to / node」を出力するための最速/ワンライナーの方法は何ですか?
したがって、この:
p>これに(xml.children.eachなどを処理してnodeCに移動したとしましょう...):
xml - NokogiriBuilderで名前空間化されたルート要素を使用してXMLドキュメントを作成する方法
名前空間を必要とするXMLデータのエクスポーターを実装しています。これを行うためにNokogiriのXMLBuilder(バージョン1.4.0)を使用していますが、Nokogiriに名前空間を持つルートノードを作成させることができません。
これは機能します:
これがそうであるように:
ただし、次のようなものが必要ですが<foo:root>
、これは機能しません。
明らかに、名前空間は使用する前に定義する必要があるため、ルートノードに名前空間を追加する方法はありません。
Nokogiriメーリングリストで「名前空間でルートノードを定義しますか? 」を見つけましたが、応答がありませんでした。
誰かが解決策を持っていますか?