私は、Web に投稿された列車の時刻表から出発時刻のリストをスクリーン スクレイピングするプロジェクトに取り組んでいます。データにアクセスするためにそのような大雑把な方法を使用していなければ、これははるかに簡単になると思いますが、利用可能な API はありません。これは、私が公にリリースすることを期待している種類のものというよりも、学習プロジェクトのようなものです。
とにかく、私が読んでいるスケジュールは、12 時間形式で表示されますが、AM/PM はありません (たとえば、9:43 だけです)。時刻をおおよその UNIX タイムスタンプとしてデータベースに保存しています。つまり、時刻が AM か PM かを判断できるスクリプトが必要です。
私がスクレイピングしているデータには、2 時間前から 6 時間後までの時間のリストが含まれている可能性があります。したがって、スクリプトが実行される午前 9 時に、次の午後 2 時の列車が一覧表示され、時間通りに出発しなかった場合、午前 7 時の列車がまだ乗車している可能性があります。
評価される時間と、「推測」の基になる現在のシステム時間の 2 つのパラメーターを取る関数を作成しました (関数に時間自体を取得させることができることはわかっていますが、単体テストを作成しようとしていました)。それはひどく失敗したので、私はそうしました)。ここに投稿したいのですが、実際にはうまくいきません。皆さんからのガイダンスやヒントを参考にして、新たに始めたいと思います。
誰でも私を助けることができますか?これにアプローチする良い方法は何ですか?