0

私はクローラーを書いていますが、機械化がタイプ以外の情報を提供できないフォームコントロールに遭遇し続けています。コントロールに関連付けられた人間が読めるテキストを取得する方法はありますか? その情報を取得する完全な方法がないため、これが少しあいまいな領域であることはわかっていますが、何か役立つことはありますか?

4

1 に答える 1

1

兄弟ノードのテキストと親ノードのテキストを探します。頻繁に存在する場所です。実際に html を解析する必要がある場合は、LXML が役立つ可能性があります。

于 2012-05-02T05:40:38.357 に答える