-1

DOM で開始/終了タグを指定し、それらの間の HTML のみを取得することで Web サイトのコンテンツをスクレイピングできるソフトウェア (OSX または Win) があるかどうか疑問に思っています。上記のコンテンツを XML または CSV にエクスポートするのが理想的ですか?

4

1 に答える 1

1

私の Xidelはそのようなことをすることができます. foo たとえば、idを使用して div 間のすべての div を取得できますbar

<div id="foo"/>
<div>{.}</div>*
<div id="bar"/>

これにはパターンマッチングを使用するため、任意の複雑さを持つ任意の多くの開始/終了要素を持つことができます

于 2013-10-22T10:26:44.480 に答える