問題タブ [html-tree]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
arrays - 更新: ハッシュ配列コンテンツの編集
私の配列には、次のようなものがあります。つまり、フォーマットは次のようになります。
Monday, June 12
をなくしたい
Monday,
<--- nb : このコンマの後にスペースがあります。
部。私が慣れているのは、タグを正規表現してから、次のようにフィルタリングすることです。
これは私にアイデアを与えました。私はこれを行うことができると思ったが、記号でコードを少し変更する
->as_text
と
[$i]
なんとなく振りかけた。方法はわかりません。たぶん、これをもっと効率的に行うための明白な方法があるでしょう@bad_array
.
ああ、また、@bad_array
最終的には次のようになります。
多分これは変更することができます:
これでしょうか?
それともこれですか?
(ソース: http://www.perlmonks.org/?node_id=477712 )
おそらくこれ?
どこmy %hash = @bad_array;
ですか?いいえ、それはできません、それはコピーで動作しています...
結果は次のとおりです。
regex - 特定の形式のすべてのリンクを抽出する
すべてのリンクを削除したいページがあります (例: http://www.stephenfry.com/ )。http://www.stephenfry.com/WHATEVERという形式のすべてのリンクを配列に入れたいと思います。私が今持っているのは、次の方法だけです。
これらのリンクだけを入れる方法がわかりません。
perl - Perl では、どのようにして URL のリストをファイルから配列にストリーミングし、すべての HTML データを単一のファイルに再帰的に取得するのでしょうか?
別の骨の折れるタイトル...申し訳ありません...とにかく、次mash.txt
のようなURLの束で呼び出されたファイルがあります:
http://www...
http://www...
http://www...
.
.
.
したがって、この時点で、これらの (URL) を配列にフィードしたいと思います (おそらく途中で何も宣言する必要はありません)。その後、それぞれから再帰的に HTML データを吸い上げ、すべてを同じ URL に追加します。ファイル--作成する必要があると思います...とにかく、事前に感謝します。
value
実際には、完全に近いうちに、設計上、各 HTML タグのタグの下の値 ( ) をこのドキュメントに一致させたいoption
ので、そのようなゴミはすべてありません...つまり、これらのそれぞれ
http://www...
このようなものを生成します
これらすべての中で必要なのは、この の各 HTML で発生する タグvalue
の下の名前だけです。option
mash.txt
perl - HTML::Tree を使用して HTML タグの値を取得する方法は?
以下に示すように、body タグの内容を保持する配列があるとします。 print Dumper(\@array);
@array の内容から「div」タグの ID を取得したいとしましょう。
私はそれを次のように行います:
これは、属性に単一の値がある場合にうまく機能します。しかし、@array の script タグから 866346569493123700 を取得するにはどうすればよいでしょうか?
私は何時間もこれを手に入れようとしてきたので、これに関する助けは大歓迎です
perl - HTML::Tree: 未定義の値に対してメソッド "as_text" を呼び出すことはできません
HTML::TreeBuilder を使用して不動産の Web ページを解析しており、次のコードがあります。
一部のページには都市または州が含まれておらず、パーサーはエラーで終了します。
それを修正するために、次の方法を使用しました。
それは機能しますが、今では 1 行ではなく 9 行になっています。このような場所がたくさんあるので、コードはかなり大きくなります。
最適化する方法はありますか?
perl - Xpath で ID が見つからない
ID でノードを取得できません。コードは簡単で、一目瞭然です。
上記のコードは以下を出力します。
ID でノードを選択するにはどうすればよいですか?
前もって感謝します。
save - 「Webページ完了」としてWebページを保存することによる静的変更
Firefox 33.0 を使用して Web サイトを「Web ページ、完了」として保存します。
問題は、メインの html ファイルの html ツリーが静的に変更されることです。保存する前に、次のようなものがありました。
保存すると、次のようになります。
Google Chrome と IE を試してみました。同じこと。
「Webページ、HTMLページのみ」で保存すると、htmlツリーがちゃんと保存されます。
それはどのような問題でしょうか?
前もって感謝します。