0

ページのコンテンツが列 1 と列 2 である 2 つの HTML ページがあります。列 1 には 2 つのページで同じデータが含まれていますが、列 2 は異なります (列 2 をカウンター値と考えてください)。この 2 つのページを比較するにはどうすればよいですか

私が持っているオプション:

1) 私が使用するツール (SoapUI の場合もあります) を使用して、スクリプトを記述し、各 HTML ページを解析します 2) Java/Perl/Python で利用可能な組み込みライブラリを使用します

私はquickdiff.comのような方法を探しています。

注: HTML ページはファイアウォールで保護されており、一般にはアクセスできません。つまり、インターネットで利用できる差分ツールは機能しません。2 つの HTML ページは、同じ Web サイトからのインスタンスです。

この問題を解決する方法についての指針はありますか?

ありがとう

編集: 前述のように、html ページには 2 つの列が含まれており、列 1 は両方のページで同じで、列 2 はカウンター値です。 column2 はページ 2 の 2 であり、これらは diff コマンドによって異なると見なされます。同一視したい。つまり、column2 を無視し、column1 の違いのみを確認します。

4

1 に答える 1

0

wgetと を使用しdiffて違いを示すことができます。

diff <(wget -q -O - http://www.site1.com/) <(wget -q -O - http://www.site2.com/)
于 2012-04-16T02:54:38.623 に答える