私はウェブサイトで働いています。さまざまな Web サイトから製品の詳細 (名前、機能、価格など) を収集し、処理して表示しています。毎日更新スクリプトを実行して、データを最新に保つことを検討しています。
- スクレイピングデータ
- それらを処理する
- データベースに保存
- (データベースから)読み取り、それらを表示します
私はすでにすべてのデータをSQLスキーマに保存していますが、よくわかりません。更新のたびに、古い記録はすべて消えています。スクレイピングされた新しいデータが何らかの形で破損した場合、表示するものは何もありません。
では、古いデータをアーカイブする一般的な方法はありますか? SQLスキーマとxmlファイルを分離するのはどちらが便利ですか? または、他の何か?