“html-tree”の関連問題_Stack Overflow日本語サイト

0 投票する

2 に答える

56 参照

arrays - 更新: ハッシュ配列コンテンツの編集

私の配列には、次のようなものがあります。つまり、フォーマットは次のようになります。

Monday, June 12

をなくしたい

Monday,<--- nb : このコンマの後にスペースがあります。

部。私が慣れているのは、タグを正規表現してから、次のようにフィルタリングすることです。

これは私にアイデアを与えました。私はこれを行うことができると思ったが、記号でコードを少し変更する

->as_text

と

[$i]

なんとなく振りかけた。方法はわかりません。たぶん、これをもっと効率的に行うための明白な方法があるでしょう@bad_array.

ああ、また、@bad_array最終的には次のようになります。

多分これは変更することができます:

これでしょうか？

それともこれですか？

(ソース: http://www.perlmonks.org/?node_id=477712 )

おそらくこれ？

どこmy %hash = @bad_array;ですか？いいえ、それはできません、それはコピーで動作しています...

結果は次のとおりです。

2014-02-14T05:07:02.057

0 投票する

1 に答える

64 参照

regex - 特定の形式のすべてのリンクを抽出する

すべてのリンクを削除したいページがあります (例: http://www.stephenfry.com/ )。http://www.stephenfry.com/WHATEVERという形式のすべてのリンクを配列に入れたいと思います。私が今持っているのは、次の方法だけです。

これらのリンクだけを入れる方法がわかりません。

regex arrays perl html-tree

2014-02-16T01:14:57.350

0 投票する

1 に答える

376 参照

perl - Perl では、どのようにして URL のリストをファイルから配列にストリーミングし、すべての HTML データを単一のファイルに再帰的に取得するのでしょうか?

別の骨の折れるタイトル...申し訳ありません...とにかく、次mash.txtのようなURLの束で呼び出されたファイルがあります:

http://www...

.

したがって、この時点で、これらの (URL) を配列にフィードしたいと思います (おそらく途中で何も宣言する必要はありません)。その後、それぞれから再帰的に HTML データを吸い上げ、すべてを同じ URL に追加します。ファイル--作成する必要があると思います...とにかく、事前に感謝します。

value実際には、完全に近いうちに、設計上、各 HTML タグのタグの下の値 ( ) をこのドキュメントに一致させたいoptionので、そのようなゴミはすべてありません...つまり、これらのそれぞれ

http://www...

このようなものを生成します

これらすべての中で必要なのは、このの各 HTML で発生するタグvalueの下の名前だけです。optionmash.txt

perl file stream append html-tree

2014-03-04T00:00:09.947

0 投票する

1 に答える

221 参照

perl - HTML::Tree を使用して HTML タグの値を取得する方法は?

以下に示すように、body タグの内容を保持する配列があるとします。 print Dumper(\@array);

@array の内容から「div」タグの ID を取得したいとしましょう。

私はそれを次のように行います：

これは、属性に単一の値がある場合にうまく機能します。しかし、@array の script タグから 866346569493123700 を取得するにはどうすればよいでしょうか?

私は何時間もこれを手に入れようとしてきたので、これに関する助けは大歓迎です

perl cpan html-tree html-treebuilder

2014-03-16T10:57:13.667

0 投票する

2 に答える

878 参照

perl - HTML::Tree: 未定義の値に対してメソッド "as_text" を呼び出すことはできません

HTML::TreeBuilder を使用して不動産の Web ページを解析しており、次のコードがあります。

一部のページには都市または州が含まれておらず、パーサーはエラーで終了します。

それを修正するために、次の方法を使用しました。

それは機能しますが、今では 1 行ではなく 9 行になっています。このような場所がたくさんあるので、コードはかなり大きくなります。

最適化する方法はありますか？

perl optimization html-parsing html-tree

2014-09-06T20:52:02.093

0 投票する

2 に答える

96 参照

perl - Xpath で ID が見つからない

ID でノードを取得できません。コードは簡単で、一目瞭然です。

上記のコードは以下を出力します。

ID でノードを選択するにはどうすればよいですか?

前もって感謝します。

perl xpath html-tree html-treebuilder

2014-09-13T16:17:33.980

0 投票する

1 に答える

63 参照

save - 「Webページ完了」としてWebページを保存することによる静的変更

Firefox 33.0 を使用して Web サイトを「Web ページ、完了」として保存します。

問題は、メインの html ファイルの html ツリーが静的に変更されることです。保存する前に、次のようなものがありました。

保存すると、次のようになります。

Google Chrome と IE を試してみました。同じこと。

「Webページ、HTMLページのみ」で保存すると、htmlツリーがちゃんと保存されます。

それはどのような問題でしょうか？

前もって感謝します。

save browser html-tree

2014-11-29T00:07:30.940

問題タブ [html-tree]

これでしょうか？

それともこれですか？

おそらくこれ？

Reference