このページから 2 番目のテーブルを取得し、解析して、このデータからハッシュを生成しようとしています。問題は、各オブジェクトがこのグレーで区切られていることですが、このテーブルからTR
すべてを取得することによってのみこれを管理できます。TR
TR
グレーの間のものを取得して適切に判断するにはどうすればよいですか?
今のところ、この行を使用してそれぞれを取得していますTR
:
parsed_html.css("table")[1].css("tr")
編集:
ハッシュがこのタスクに適しているかどうかはわかりませんが、「リフトとショアリング」セクションの JSON を次に示します (これはサンプル 1 であり、自由に修正してください)。
{
"chapter":"07",
"title":"LIFTING AND SHORING",
"description":"This chapter shall...",
"section":[
{
"number":"00",
"title":"GENERAL",
"description":"",
},
{
"number":"10",
"title":"JACKING",
"description":"Provides information relative...",
},
{
"number":"20",
"title":"SHORING",
"description":"Those instructions necessary...",
}
]
}