私はこの質問を見てきました。これは非常に素晴らしく有益です。ただし、かなり一般的なシナリオは扱いません。
多数の Web サイト (または同じドメイン内のページでさえも) をスクレイピングする必要があるとしますが、その Web サイトの作成者は自分のコードを十分に気にかけておらず、「ちょっと機能する」重大な不正なコードをいくつか持っています。そのウェブサイトから情報を取得する必要があります。
この場合はどうすればいいですか?理想的には行かないでください。
出来ますか?RegExp に戻す必要がありますか?