問題タブ [mojo-dom]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
perl - タグのコンテンツ内のすべてのスペースを ` ` に置き換えます
仕事
タグのコンテンツ内のすべてのスペースを に置き換えます
。
y.html (サンプルファイル)
私が試したこと
上記のスクリプトの結果
目的の出力が得られません
。タグも追加しています (例: </span
)。コンテンツに対してのみ実行したいです。
PS: で試してみましたがMojo::DOM
、使用する必要はありません。必要に応じて他のパーサーを試すことができます。それでも、コードの何が問題なのか知りたいですか?
perl - Perl で HTML ファイルをスクレイピングし、コンテンツのみを順番に返す
HTML::TreeBuilder -- または Mojo::DOM -- を使用して、コンテンツをスクレイピングしたいのですが、テキスト値を配列に入れることができるように (そして、テキスト値を変数に置き換えます)テンプレート目的)
しかし、これは TreeBuilder で
順序を返しません -- もちろん、ハッシュは順序付けされていません。では、ルートからツリーにアクセスして、返された一連の値を保持するにはどうすればよいでしょうか。再帰的にツリーを歩きますか? 基本的に、各要素以外は「as_text」メソッドを使いたいと思います。(この素晴らしいアイデアに従いましたが、すべての要素に必要です)
perl - Mojo::DOM - 複数の属性を返す方法
私は Mojolicious が初めてで、クラス Module を含む ap タグ内のリンクのタイトルを見つけます。
次のコードを使用します。
かなり粗いですが、機能的です。まだ理解できないのは (私には夜遅くなる可能性があります)、href とリンク テキストを返す方法です。私を不幸から解放してください。