私は多くのhtml応答コードを持っています.いくつかの部分にこの部分があります:
</td>
</tr>
<input id="hiddenloginurl" type="hidden" name="loginurl" value="/sensor.htm?id=10240">
</table>
HTML コードを解析し、Python でこの ID を取得するにはどうすればよいですか? 問題は、新しい API 呼び出しごとに ID が変更されることです。
Beautiful Soup は、解析ツリーをナビゲート、検索、および変更するためのいくつかの単純なメソッドと Python のイディオムを提供します。これは、ドキュメントを分析し、必要なものを抽出するためのツールキットです。アプリケーションを書くのに多くのコードは必要ありません
Beautiful Soup は、受信ドキュメントを Unicode に、送信ドキュメントを UTF-8 に自動的に変換します。ドキュメントでエンコーディングが指定されておらず、Beautiful Soup がエンコーディングを自動検出できない場合を除き、エンコーディングについて考える必要はありません。次に、元のエンコーディングを指定するだけです。
Beautiful Soup は、lxml や html5lib などの一般的な Python パーサーの上にあるため、さまざまな解析戦略を試したり、速度を犠牲にして柔軟性を得ることができます。
この同様の質問も参照してください:beautifulsoupで属性値を抽出する
inputTag = soup.find(attrs={"name": "stainfo"})
output = inputTag['value']