ウェブサイトから html をダウンロードし、コードを反復処理して特定の変化する値 (この場合は製品の価格) を見つける必要がある webapp を開発しています。
このため、ユーザーに (インストールとセットアップ時に) ページ (価格がある) から数行の html をシステムに提供するように依頼することを考えていました。それらの行を検索して価格を見つけようとします。
現在、これは恐ろしく遅い方法だと思います。ルールがなく、html が Web サイトごとにまったく異なる可能性があるため (同じ Web サイトでも変更される可能性があります)、より良い方法を見つけることができませんでした。
私が考えた 1 つの改善点は、最初から繰り返し、コードを見つけた行を記録することでした。見つかったら、それ以降は予想される場所の数行前から検索を開始します。これを改善する方法について何か考えはありますか?
この質問をhttps://cstheory.stackexchange.com/に投稿しましたが、彼らはそれはトピックではなく、ここに投稿する必要があるとコメントしました。
上記のコードがあり、必要に応じて投稿できます。これを行うためのより良い、より高速な方法が必要だと単純に考えています。