wget を使用して、URL から html ファイルを取得するとします。その HTML ファイルから HAR ファイルを生成するにはどうすればよいですか。
- html ファイルから har ファイルを生成するためのオープン ソースの実装はありますか?
- HAR ファイルが生成されたら、 harlibを使用して HAR ファイルからデータを読み取ることができます。
可能であれば、C、C++、または Java の実装を提案してください。
wget を使用して、URL から html ファイルを取得するとします。その HTML ファイルから HAR ファイルを生成するにはどうすればよいですか。
可能であれば、C、C++、または Java の実装を提案してください。
HAR 形式の主なポイントは、多くのツールが使用および分析できる標準の HTTP トレース形式を持つことです。言い換えれば、本来の目的はパフォーマンス分析のためであり、Web ページ自体を「アーカイブ」することではありません。
でページをフェッチするとwget
、すべてのパフォーマンス データの 99% が失われます。必要なデータをキャプチャするには、リクエストを実行し、関連するすべてのリソースをフェッチし、すべてのタイマーを保存するなどのブラウザが必要です。これにより、ウォーターフォール チャートなどを作成できます。
サーバーでこのデータをキャプチャする必要がある場合は、pcap を使用して TCP トレースをキャプチャし、それを HARに変換できますが、実際に HTML を解析してすべてのサブリソースを要求するクライアントが必要です (pcap はバックグラウンドで聞いているだけです)。または、プロキシ経由でブラウザをルーティングし、HAR ファイルを吐き出すようにすることもできます。
最後になりましたが、デバッグ インターフェイスを介してブラウザーを駆動し、HAR ファイルをそのようにエクスポートすることができます。Firefox を駆動するための Java の例: https://github.com/Filirom1/browsermob-page-perf