C#ウィンドウフォームでWebスクレイパーを開発したいと思っています。私が達成しようとしていることは次のとおりです。
- ユーザーからURLを取得します。
- WINFormsのIEUIコントロール(埋め込みブラウザ)にWebページをロードします。
- ユーザーがテキストを選択できるようにします(連続、小さい(50文字を超えない))。ロードされたWebページから。
- ユーザーが場所(HTML DOMの場所)を永続化する場合は、DBに永続化する必要があります。これにより、ユーザーはその場所を使用して、次回のアクセス時にその場所のデータをフェッチできます。
ロードされたWebサイトが価格表サイトであり、見積もりレートが変化し続けると仮定すると、次回トラバースできるようにDOM階層を永続化するというアイデアがあります。
すべてのHTML要素にid属性があれば、これを行うことができます。idがnullの場合、これを実行できません。
誰かがこれについて有効なアイデアを提案できますか(可能であれば最小限のコードスニペット)?
あなたがいくつかのオンラインリソースを共有することができるとしても、それは役に立ちます。
ありがとう、
ビジェイ