私はあなたが多くのeコマースウェブサイトで製品を検索することを可能にするeコマース検索エンジンを開発しています。
どうすれば問題に取り組むことができますか?
Webサイトをスキャンし、HTMLを解析して、Webサイト内のどの画像が製品画像であるか、製品の説明であるか、製品の価格であるかを判別できるアプリケーションが必要です。
どんなアイデア、例でも聞いてうれしいです。
前もって感謝します。
編集:私の質問は、WebサイトからHTMLを取得する方法(スクリーンスクレイピングと呼ばれます)ではなく、その情報を解析して、探している実際のデータが含まれているHTMLと含まれていないHTMLを理解する方法についてです。