1

Bash スクリプトでいくつかのハイパー参照を取得する必要があります。

次のコマンドはcurl、 とを使用して、HTML ページのすべての属性xmllintを読み取ります。href

curl --silent -L google.com | xmllint --html --xpath '//a/@href' - 

しかし、属性の値だけが必要です。属性の値は関数で選択できますstring()。しかし、それを使用すると、属性のリストの最初の要素のみが取得されます。

curl --silent -L google.com | xmllint --html --xpath 'string(//a/@href)' - 

string()関数を各属性に適用するにはどうすればよいですか?

4

1 に答える 1

0

You could do (notice the difference in the XPath expression):

curl --silent -L google.com | xmllint --html --xpath '//a/@*'

and then add another pipe to send the output to sed, filtering out the attribute names to get the values you want. But this is a sort of odd way to extract stuff from a document.

于 2014-11-14T20:29:31.050 に答える