問題タブ [html-tree]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
56 参照

arrays - 更新: ハッシュ配列コンテンツの編集

私の配列には、次のようなものがあります。つまり、フォーマットは次のようになります。

Monday, June 12

をなくしたい

Monday,<--- nb : このコンマの後にスペースがあります。

部。私が慣れているのは、タグを正規表現してから、次のようにフィルタリングすることです。

これは私にアイデアを与えました。私はこれを行うことができると思ったが、記号でコードを少し変更する

->as_text

[$i]

なんとなく振りかけた。方法はわかりません。たぶん、これをもっと効率的に行うための明白な方法があるでしょう@bad_array.

ああ、また、@bad_array最終的には次のようになります。


多分これは変更することができます:


これでしょうか?

それともこれですか?

(ソース: http://www.perlmonks.org/?node_id=477712 )

おそらくこれ?

どこmy %hash = @bad_array;ですか?いいえ、それはできません、それはコピーで動作しています...


結果は次のとおりです。

0 投票する
1 に答える
64 参照

regex - 特定の形式のすべてのリンクを抽出する

すべてのリンクを削除したいページがあります (例: http://www.stephenfry.com/ )。http://www.stephenfry.com/WHATEVERという形式のすべてのリンクを配列に入れたいと思います。私が今持っているのは、次の方法だけです。

これらのリンクだけを入れる方法がわかりません。

0 投票する
1 に答える
376 参照

perl - Perl では、どのようにして URL のリストをファイルから配列にストリーミングし、すべての HTML データを単一のファイルに再帰的に取得するのでしょうか?

別の骨の折れるタイトル...申し訳ありません...とにかく、次mash.txtのようなURLの束で呼び出されたファイルがあります:

http://www...

http://www...

http://www...

.

.

.

したがって、この時点で、これらの (URL) を配列にフィードしたいと思います (おそらく途中で何も宣言する必要はありません)。その後、それぞれから再帰的に HTML データを吸い上げ、すべてを同じ URL に追加します。ファイル--作成する必要があると思います...とにかく、事前に感謝します。


value実際には、完全に近いうちに、設計上、各 HTML タグのタグの下の値 ( ) をこのドキュメントに一致させたいoptionので、そのようなゴミはすべてありません...つまり、これらのそれぞれ

http://www...

このようなものを生成します

これらすべての中で必要なのは、この の各 HTML で発生する タグvalueの下の名前だけです。optionmash.txt

0 投票する
1 に答える
221 参照

perl - HTML::Tree を使用して HTML タグの値を取得する方法は?

以下に示すように、body タグの内容を保持する配列があるとします。 print Dumper(\@array);

@array の内容から「div」タグの ID を取得したいとしましょう。

私はそれを次のように行います:

これは、属性に単一の値がある場合にうまく機能します。しかし、@array の script タグから 866346569493123700 を取得するにはどうすればよいでしょうか?

私は何時間もこれを手に入れようとしてきたので、これに関する助けは大歓迎です

0 投票する
2 に答える
878 参照

perl - HTML::Tree: 未定義の値に対してメソッド "as_text" を呼び出すことはできません

HTML::TreeBuilder を使用して不動産の Web ページを解析しており、次のコードがあります。

一部のページには都市または州が含まれておらず、パーサーはエラーで終了します。

それを修正するために、次の方法を使用しました。

それは機能しますが、今では 1 行ではなく 9 行になっています。このような場所がたくさんあるので、コードはかなり大きくなります。

最適化する方法はありますか?

0 投票する
2 に答える
96 参照

perl - Xpath で ID が見つからない

ID でノードを取得できません。コードは簡単で、一目瞭然です。

上記のコードは以下を出力します。

ID でノードを選択するにはどうすればよいですか?

前もって感謝します。

0 投票する
1 に答える
63 参照

save - 「Webページ完了」としてWebページを保存することによる静的変更

Firefox 33.0 を使用して Web サイトを「Web ページ、完了」として保存します。

問題は、メインの html ファイルの html ツリーが静的に変更されることです。保存する前に、次のようなものがありました。

保存すると、次のようになります。

Google Chrome と IE を試してみました。同じこと。

「Webページ、HTMLページのみ」で保存すると、htmlツリーがちゃんと保存されます。

それはどのような問題でしょうか?

前もって感謝します。