私は現在、ヨーロッパの財団に関するデータを含むサイトを解析するアプローチに取り組んでいます。
http://www.foundationfinder.ch/には 790 の財団のデータセットがあります。すべてのデータは自由に使用でき、著作権の制限はありません。
目標は何ですか: データを解析してローカルに保存したい: より良い検索とより便利な使用方法のために: おそらく、それを Calc に保存することも、より良い MySQL-Database にすることもできます。
質問: Perl で HTML を解析する最も簡単な方法は何ですか? LWP と Mechanize のどちらを使用する必要がありますか?
何人かの友人が私に Python を試してみるように言った!? 美しいスープ。Perl LWP や Python Beautiful Soup を使ったアプローチを考えました。私が見ることができないようなサイトを解析するための他のアプローチ。さて、方法があります-PHPを使用します。はい、どうにかして PHP (および Curl) を使用できます。
どのアプローチが最適です。Perl と LWP または Mechanize? またはPythonのもの...?
言語の問題以外に、最初のステップで誰か助けてくれませんか? ・トラックに乗るのを手伝う!? ご連絡をお待ちしております
よろしくゼロ