python - PythonでHTMLコードから特定のIDを取得するにはどうすればよいですか?

Question

私は多くのhtml応答コードを持っています.いくつかの部分にこの部分があります:

</td>
</tr>
    <input id="hiddenloginurl" type="hidden" name="loginurl" value="/sensor.htm?id=10240">
</table>

HTML コードを解析し、Python でこの ID を取得するにはどうすればよいですか? 問題は、新しい API 呼び出しごとに ID が変更されることです。

score 0 · Accepted Answer

美しいスープ

Beautiful Soup は、解析ツリーをナビゲート、検索、および変更するためのいくつかの単純なメソッドと Python のイディオムを提供します。これは、ドキュメントを分析し、必要なものを抽出するためのツールキットです。アプリケーションを書くのに多くのコードは必要ありません

Beautiful Soup は、受信ドキュメントを Unicode に、送信ドキュメントを UTF-8 に自動的に変換します。ドキュメントでエンコーディングが指定されておらず、Beautiful Soup がエンコーディングを自動検出できない場合を除き、エンコーディングについて考える必要はありません。次に、元のエンコーディングを指定するだけです。

Beautiful Soup は、lxml や html5lib などの一般的な Python パーサーの上にあるため、さまざまな解析戦略を試したり、速度を犠牲にして柔軟性を得ることができます。

この同様の質問も参照してください：beautifulsoupで属性値を抽出する

inputTag = soup.find(attrs={"name": "stainfo"})
output = inputTag['value']

python - PythonでHTMLコードから特定のIDを取得するにはどうすればよいですか?

1 に答える 1

Related

Reference