DOM で開始/終了タグを指定し、それらの間の HTML のみを取得することで Web サイトのコンテンツをスクレイピングできるソフトウェア (OSX または Win) があるかどうか疑問に思っています。上記のコンテンツを XML または CSV にエクスポートするのが理想的ですか?
質問する
86 次
1 に答える
1
私の Xidelはそのようなことをすることができます. foo
たとえば、idを使用して div 間のすべての div を取得できますbar
。
<div id="foo"/>
<div>{.}</div>*
<div id="bar"/>
これにはパターンマッチングを使用するため、任意の複雑さを持つ任意の多くの開始/終了要素を持つことができます
于 2013-10-22T10:26:44.480 に答える