このサイトTR
のそれぞれからA JSON オブジェクトを作成したい。
今のところ、テーブル全体とそれぞれを取得できますTR
が、それだけでは十分ではありません...それが私が混乱している理由です。
これは、返してほしい JSON の例です。これはチャプター07のものです:
{
"chapter":"07",
"title":"LIFTING AND SHORING",
"description":"This chapter shall...",
"section":[
{
"number":"00",
"title":"GENERAL",
"description":"",
},
{
"number":"10",
"title":"JACKING",
"description":"Provides information relative...",
},
{
"number":"20",
"title":"SHORING",
"description":"Those instructions necessary...",
}
]
}
必要なのは、このすべてを一度に取得することですが、これまでに管理したものは次のとおりです。
parsed_html.css("table")[1].css("tr")
解析には Nokogiri を使用しています。