タグに基づいて新しいツイートと instagram の写真 (および潜在的に他のサービス) を定期的に検索する 2 つの cron ジョブを構築しています。
コンテンツはデータベースに保存され、後で Web ページに出力されます。これにより、読み込みが速くなり、さらに重要なことに、特定のツイートを削除して表示されないようにすることができます。
投稿がデータベースに 2 回保存されないようにしたいのですが、どのアプローチが最適かわかりません。ここに私が検討するいくつかのオプションがあります:
- 私は Laravel を使用しており、postID が一意であることを要求する機能があります。これにより、既存の投稿を保存しようとするとデータベースが拒否されます。ただし、これは不要な sql-query をレンダリングする可能性があります。
- データベースで最新の保存された投稿 ID を確認し、その投稿に到達したらループを停止できます。
- 少なくとも Twitter では、パラメーター since_id を渡すことができます。これにより、最新の投稿を取得することができます。ただし、インスタグラムで同じパラメーターが見つからず、html スクレイピングでも機能しません。