これは間違いなくできます。しかし、Excel は解析を行うのに最適なツールではありません (私はそれを実行しましたが、人々は不可能だと言いました - 非同期の Windows API 呼び出しを使用して実行できます。頑張ってください...)
あなたがしなければならない最初の質問は、サイトが動的かどうかです。その場で結果を生成していますか?もう 1 つの質問は、一貫性のある URL 規則ですか? (つまり、結果をブックマークして、サイトにログオンするだけで、別のセッションでそれらに戻ることができますか...)
サイトが静的であるか、一貫した URL クエリ メカニズムを備えている場合 (HTML では、Web クエリは "POST" フォームではなく "GET" です...)、Python のような優れたパーサー指向の言語を使用できます。 Web ページにアクセスするライブラリを使用する。例はGoogleにたくさんあるはずです。すべてのデバッグが完了し、確実に動作するようになったら (サイトにアクセスできない場合に状況をインテリジェントに報告することもテストします。そのために一時的にネットワーク接続を切断します...)、Excel マクロから次のようにシェルできます。 Python スクリプト。秘訣は、Excel のバニラ シェルはシェル化されたコマンドをブロックせず、非同期で実行されることです。再度 Google を使用すると、Excel からシェルへ、取得タスクを同期的に実行できる Windows API 呼び出しを見つけることができます (完了するまでブロックしなかった場合は、
このデザインのポイントがわかりますか?基本単位。解析にバグがある場合は、CSV を見るだけで簡単に判断できます。そして、特殊化を利用しています。解析用に設計されたプログラミング言語(Pythonなど)を使用しています。VBA は実際には解析言語ではありません。
静的な Web ページではなく、一意のエントリを作成する必要がある動的な Web ページの場合はどうなるでしょうか? 次に、Excel マクロから奇妙な Windows API 呼び出しを使用して実行する以外に、Greasemonkey または C# を使用して動的解析スクリプトを作成できます。Greasemonkey は Firefox 用のプラグインで、Javascript を使用して Web サイトの対話をスクリプト化できます。それはかなり直感的です。このアプローチを採用した場合、事前定義された Greasemonkey スクリプトが構成されているページの Firefox ブラウザーにシェルできます。繰り返しますが、Greasemonkey はデータのテキスト ファイルを生成でき、後で簡単にデバッグできます。私が聞いた別のオプションは C# です。Microsoft 固有なので試したことはありませんが、多くのショップがそのようにしているのを目にします。HTMLunit と呼ばれる Java 解析パッケージもあります。しかし、Web ページで Javascript イベントをエミュレートしようとすると、壊れていることがわかりました。その他の HTML パーサーとしては、Jerry と Cobra があります。そしてSeleniumという新製品があります。実際のブラウザを使用して動作するため、Greasemonkey が最も信頼できることがわかりました。一方、Selenium を除いて、これらの他の製品はブラウザーの仮想複製を作成しますが、残念ながら、そうしないことがよくあります。Web ページ上にあるかもしれない Javascript をわざわざ複製しようとさえしない人もいます (これは、多くの場合、Web サイトのページがどのようにレンダリングされるかの肉とジャガイモになる可能性があります!) これらの他の製品は、ブラウザーの仮想複製を作成しますが、残念ながら、多くの場合失敗します。Web ページ上にあるかもしれない Javascript をわざわざ複製しようとさえしない人もいます (これは、多くの場合、Web サイトのページがどのようにレンダリングされるかの肉とジャガイモになる可能性があります!) これらの他の製品は、ブラウザーの仮想複製を作成しますが、残念ながら、多くの場合失敗します。Web ページ上にあるかもしれない Javascript をわざわざ複製しようとさえしない人もいます (これは、多くの場合、Web サイトのページがどのようにレンダリングされるかの肉とジャガイモになる可能性があります!)
楽しむ。これはプールの最深部ですが、それはあなたを忙しくし、有益な雇用を維持するものです.