状況:
私がスクレイプする各ページには、との<input>要素がありますtitle=value=
ページに何が表示されるかわかりません。
収集したすべてのデータを、タイトルごとに1つの列を付けて、最後に1つのテーブルにまとめたいと思います。
したがって、基本的に、データの各行を他のすべての行と整列させる必要があります。行に特定の要素がない場合は、空白にする必要があります(ただし、整列を維持するために何かが必要です)。
例えば。
最初のページは次のとおりです。{animal: cat, colour: blue, fruit: lemon, day: monday}
2ページ目は次のとおりです。{animal: fish, colour: green, day: saturday}
3ページ目は:{animal: dog, number: 10, colour: yellow, fruit: mango, day: tuesday}
次に、結果のテーブルは次のようになります。
animal | number | colour | fruit | day
cat | none | blue | lemon | monday
fish | none | green | none | saturday
dog | 10 | yellow | mango | tuesday
ペアの順序を維持するのは良いことですが、title value辞書ではそうはなりません。
したがって、基本的に、すべてから列を生成する必要がありますtitles(順番に保持されていますが、どういうわけか一緒にマージされています)
考えられるすべてのタイトルを知らずに、値を入力する順序を明示的に指定せずに、これを実行するための最良の方法は何でしょうか。