1

Beautiful Soup を使用して特定の<table>要素を分離し、それを新しいファイルに入れようとしています。テーブルには id がありModelTable、を使用して見つけることができますsoup.select("#ModelTable")(「スープ」はインポートされたファイルです)。

ただし、要素を新しいファイルに入れる方法がわかりません。単に新しいファイルに書き込むだけでは (:write(soup.select("#ModelTable")のように) 機能しません。これは文字列オブジェクトではないためです。これを変換するとstr()、角かっこで囲まれた文字列になります。

.prettify()理想的には、実行後に分離された要素をエクスポートできるようにして、すぐに適切な HTML ファイルを取得できるようにしたいと考えています。明らかな何かが欠けているに違いないことはわかっています...何かヒントはありますか?

4

1 に答える 1

0

返されたオブジェクトの内容を反復処理する必要があります。あなたの質問は、BS4 が CSS セレクターを使用していることも教えてくれました.select。これは素晴らしいことです。

with open('file_output.html', 'w') as f:
  for tag in soup.select("#ModelTable"):
    f.write(tag.prettify())
于 2013-11-07T16:23:34.540 に答える