0

最近、非常に大量のデータをスクレイピングする必要があり、フィード形式を「json」から「jsonlines」に変更して、すべてがスクランブルされて複製されるのを避けました。問題は、エクスポートされたファイルが JSON として認識されるプログラムがないことです。これは、各項目の先頭と末尾の角かっことコンマが削除されるためです。最初の例はデータがどのように見えるかを示し、2 番目の例は私が達成したいことを示しています。

    {"name": "Color TV", "price": "1200"}
    {"name": "DVD player", "price": "200"}

    ---------------------------------------

    {"data" : [
    {"name": "Color TV", "price": "1200"},
    {"name": "DVD player", "price": "200"},
    {"name": "Color TV", "price": "1200"}
    ]}

JsonLinesItemExporter を使用している間に、コンマを手動で追加して配列にする方法はありますか?

関連すると思われるクローラーの唯一のコードは、yield キーワードですが、喜んで完全なコードを示します。PHP や MySQL は使用していません。

事前にどうもありがとうございました。

    yield {
            "name": name,
            "old_price": old_price,
            "discount_price": discount_price
        }
4

1 に答える 1