サイトからデータをスクレイピングしようとしています。データは、それぞれが一連のデータを持つ複数のオブジェクトとして構造化されています。たとえば、名前、年齢、職業を持つ人。
私の問題は、このデータが Web サイトの 2 つのレベルに分割されていることです。
たとえば、最初のページは名前と年齢のリストで、各人のプロフィール ページへのリンクがあります。
彼らのプロフィールページには、彼らの職業がリストされています。
私はすでに、トップレイヤーからデータを収集し、複数のページネーションをクロールできるPythonのスクレイピーで書かれたスパイダーを持っています。
しかし、適切なオブジェクトへのリンクを維持しながら、内部ページからデータを収集するにはどうすればよいでしょうか?
現在、jsonで構造化された出力があります
{[name='name',age='age',occupation='occupation'],
[name='name',age='age',occupation='occupation']} etc
解析機能はそのようにページをまたいで到達できますか?