最近、非常に大量のデータをスクレイピングする必要があり、フィード形式を「json」から「jsonlines」に変更して、すべてがスクランブルされて複製されるのを避けました。問題は、エクスポートされたファイルが JSON として認識されるプログラムがないことです。これは、各項目の先頭と末尾の角かっことコンマが削除されるためです。最初の例はデータがどのように見えるかを示し、2 番目の例は私が達成したいことを示しています。
{"name": "Color TV", "price": "1200"}
{"name": "DVD player", "price": "200"}
---------------------------------------
{"data" : [
{"name": "Color TV", "price": "1200"},
{"name": "DVD player", "price": "200"},
{"name": "Color TV", "price": "1200"}
]}
JsonLinesItemExporter を使用している間に、コンマを手動で追加して配列にする方法はありますか?
関連すると思われるクローラーの唯一のコードは、yield キーワードですが、喜んで完全なコードを示します。PHP や MySQL は使用していません。
事前にどうもありがとうございました。
yield {
"name": name,
"old_price": old_price,
"discount_price": discount_price
}