4

wget を使用して、URL から html ファイルを取得するとします。その HTML ファイルから HAR ファイルを生成するにはどうすればよいですか。

  1. html ファイルから har ファイルを生成するためのオープン ソースの実装はありますか?
  2. HAR ファイルが生成されたら、 harlibを使用して HAR ファイルからデータを読み取ることができます。

可能であれば、C、C++、または Java の実装を提案してください。

4

1 に答える 1

5

HAR 形式の主なポイントは、多くのツールが使用および分析できる標準の HTTP トレース形式を持つことです。言い換えれば、本来の目的はパフォーマンス分析のためであり、Web ページ自体を「アーカイブ」することではありません。

でページをフェッチするとwget、すべてのパフォーマンス データの 99% が失われます。必要なデータをキャプチャするには、リクエストを実行し、関連するすべてのリソースをフェッチし、すべてのタイマーを保存するなどのブラウザが必要です。これにより、ウォーターフォール チャートなどを作成できます。

サーバーでこのデータをキャプチャする必要がある場合は、pcap を使用して TCP トレースをキャプチャし、それを HARに変換できますが、実際に HTML を解析してすべてのサブリソースを要求するクライアントが必要です (pcap はバックグラウンドで聞いているだけです)。または、プロキシ経由でブラウザをルーティングし、HAR ファイルを吐き出すようにすることもできます。

最後になりましたが、デバッグ インターフェイスを介してブラウザーを駆動し、HAR ファイルをそのようにエクスポートすることができます。Firefox を駆動するための Java の例: https://github.com/Filirom1/browsermob-page-perf

于 2012-05-12T16:08:12.177 に答える