私はWgetを使用して、新しいプラットフォームに移行するためのサイトをスクレイプしました。ページをクリーンアップして、ページ内のすべてのビューステートコードを削除しようとしています。これを行うために、次の正規表現を使用しています。
<input type="hidden" name="__VIEWSTATE" value=.*/>
これは、dreamweaverなどのプログラムで機能します。私はWildEditと呼ばれる別のアプリケーションを使用するのが好きです。これは、検索と多数のファイルの置換に非常に高速です。同じ式を使用すると、ページの最後の式と一致し、/>
多くの適切なコードが削除されます。私も<input type="hidden" name="__VIEWSTATE" value=.*/>$
同じ結果で試しました。
/>の最初の一致に保つためにこれをどのように制約しますか