SHスクリプト、Webページのタイトル、説明などのメタデータ、Webページの小さなスクリーンショットなどから取得するために使用できる方法やツールはありますか?
前もって感謝します!
curl または wget を使用して Web ページを取得し、それを sed にパイプしてさまざまなタグのコンテンツを取得できます。としてはぎこちないですが、シェルスクリプトでこのようなことをしている場合、それはあなたが得ようとしているものです.
例えば
wget http://example.com -O - | grep \<title\>|sed "s/\<title\>\([^<]*\).*/\1/"
タイトルタグの内容を表示します。この例では、解析されていない未加工のソースが提供されるためIANA — Example domains
、IANA – Example domains
.
perl のようなものを使用することを検討しましたか?