問題タブ [mojo-dom]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
918 参照

perl - タグのコンテンツ内のすべてのスペースを ` ` に置き換えます

仕事

タグのコンテンツ内のすべてのスペースを に置き換えます 

y.html (サンプルファイル)

私が試したこと

上記のスクリプトの結果

目的の出力が得られません&nbsp;。タグも追加しています (例: </span&nbsp;)。コンテンツに対してのみ実行したいです。

PS: で試してみましたがMojo::DOM、使用する必要はありません。必要に応じて他のパーサーを試すことができます。それでも、コードの何が問題なのか知りたいですか?

0 投票する
1 に答える
263 参照

perl - Perl で HTML ファイルをスクレイピングし、コンテンツのみを順番に返す

HTML::TreeBuilder -- または Mojo::DOM -- を使用して、コンテンツをスクレイピングしたいのですが、テキスト値を配列に入れることができるように (そして、テキスト値を変数に置き換えます)テンプレート目的)

しかし、これは TreeBuilder で

順序を返しません -- もちろん、ハッシュは順序付けされていません。では、ルートからツリーにアクセスして、返された一連の値を保持するにはどうすればよいでしょうか。再帰的にツリーを歩きますか? 基本的に、各要素以外は「as_text」メソッドを使いたいと思います。(この素晴らしいアイデアに従いましたが、すべての要素に必要です)

0 投票する
2 に答える
147 参照

perl - Mojo::DOM - 複数の属性を返す方法

私は Mojolicious が初めてで、クラス Module を含む ap タグ内のリンクのタイトルを見つけます。

次のコードを使用します。

かなり粗いですが、機能的です。まだ理解できないのは (私には夜遅くなる可能性があります)、href とリンク テキストを返す方法です。私を不幸から解放してください。