私にとって重要なデータを持っている Web サイトがいくつかありますが、このデータを取得するための API 関数はありません。そして、この情報を取得したいし、さらに独自の API を作成したいと考えています。
最初の問題は、これらの Web サイトがログイン ページの背後にデータを保存しているため、このデータを取得する前にそこに入らなければならないことです。
Web サイトは JS を使用してデータを取得し、クエリを送り返します。また、SSL プロトコルがあるため、すべてのトラフィックが暗号化されます。
私の考えは
- Wireshark でトラフィックをキャプチャします。
- それを解読します。
- パッケージをよく見てください。
- これが問題です。TCP セッションを再構築できるツールはありますか?
そして最後に。TCP セッションを偽造するある種の API を作成できますか? Web サーバーはこのセッションを実際のブラウザーとのセッションとして識別しますか、それとも不可能ですか? セレンについて読んだことがありますが、システムのリソースが多すぎます。