問題タブ [jsonlines]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - JSONlines を使用して大量のデータをスクレイピングするときに適切な JSON 構造を維持する
最近、非常に大量のデータをスクレイピングする必要があり、フィード形式を「json」から「jsonlines」に変更して、すべてがスクランブルされて複製されるのを避けました。問題は、エクスポートされたファイルが JSON として認識されるプログラムがないことです。これは、各項目の先頭と末尾の角かっことコンマが削除されるためです。最初の例はデータがどのように見えるかを示し、2 番目の例は私が達成したいことを示しています。
JsonLinesItemExporter を使用している間に、コンマを手動で追加して配列にする方法はありますか?
関連すると思われるクローラーの唯一のコードは、yield キーワードですが、喜んで完全なコードを示します。PHP や MySQL は使用していません。
事前にどうもありがとうございました。