これが可能かどうかはわかりませんが、Javascript を使用してデータをレンダリングする Web ページからデータを取得したいと考えています。これは、Linux シェルからのものです。
私が今できること:
curl/lynx/wget を使用してログインし、コマンド ラインからヘッダーを取得する http 投稿
コマンドラインでヘッダーを使用して、Webページの「安全な」場所にアクセスします
ただし、ページに表示される要素は静的 html のみです。私が必要とする情報のほとんどは、js を使用して動的にレンダリングされ (最終的には html としても表示されます)、コマンド ライン ブラウザーには表示されません。問題はjsインタープリターの欠如にあることを理解しています。
そのため...私が考えたいくつかの回避策は次のとおりです。
コマンドラインから完全なブラウザーを呼び出し、何らかの方法で情報を stdout に戻します。これは、POST できる必要があることを意味します。
ヘッダーを (セッション情報などを使用して) 渡し、curl からこれらの完全なブラウザーの 1 つに取得し、出力 html を再び stdout にダンプします。他のすべてが失敗した場合、ウィンドウのプリントスクリーン機能である可能性があります。
純粋な Java ソリューションでも問題ありません。
似たようなことをして成功した経験のある人はいますか?
ありがとう!