HTMLWebページのいくつかの値を取得する必要があります。名前、ID、またはクラスでフィルタリングされたタグの値のみが必要です(XPathがサポートされている場合も歓迎しますvalue
)。input
これは非常に単純なことです。このため、「複雑でない」パーサーを探しています。プログラムに大量のコードが必要ないため(このようなコードを使用しました)、無料で軽量かつ高速である必要があります。
質問する
145 次
1 に答える
1
libxml2を使用できます。その名前にもかかわらず、HTMLパーサーHTMLパーサーモジュール--libxml2が含まれています。
私はPythonバインディングを使用しましたが、高速でXPathをサポートしています。
于 2012-06-16T14:11:53.023 に答える