-1

HTMLWebページのいくつかの値を取得する必要があります。名前、ID、またはクラスでフィルタリングされたタグの値のみが必要です(XPathがサポートされている場合も歓迎しますvalue)。inputこれは非常に単純なことです。このため、「複雑でない」パーサーを探しています。プログラムに大量のコードが必要ないため(このようなコードを使用しました)、無料で軽量かつ高速である必要があります。

4

1 に答える 1

1

libxml2を使用できます。その名前にもかかわらず、HTMLパーサーHTMLパーサーモジュール--libxml2が含まれています。
私はPythonバインディングを使用しましたが、高速でXPathをサポートしています。

于 2012-06-16T14:11:53.023 に答える