0

Mac OS X でのスクリーン スクレイピングについてもっと知りたいと思っています。

基本的に、私がそれについて考えている理由は、かなり面白い偽の twitter アカウントを持っているコメディアンがいて、過去のツイートをすべて読む唯一の方法は、私が見つけたアーカイブされたサイトからであるということです. サイトの設定方法は、それがメイン ページであり、過去 2 年間毎日へのリンクがあるというものです (ページを下る基本的なアンカー タグのみ)。これは非常にシンプルなサイトで、データをスクレイピングしてファイルに入れることができれば、何百ものリンクをクリックする代わりに、1 か所ですべてを読むことができると考えました。

私は基本的に、このコーディング方法を学ぶための言い訳としてこれを使用しています。

私はグーグルで検索しましたが、多くを見つけることができないようです。PHP コードは少し理解できましたが (PHP は得意です)、ページ上のリンクからデータを取得できるかどうかはわかりませんでした。単一の画面からスクレイピングするのは比較的簡単に思えます。

私の他の質問は、コードをどのように実行するのですか? Windows と Linux 用のプログラムはいくつか見たことがありますが、Mac OS X 用のプログラムはまだ使用できません (OS 10.8 を使用しています)。

誰かが私を正しい方向に向けることができますか? ありがとう!

4

1 に答える 1

1

このプロジェクトをPythonを学ぶための言い訳と考えてください。慣れるのはかなり速く、これを含め、あなたが夢見ることができるほとんどすべてを処理するための素晴らしいパッケージがたくさんあります。

私はこれを数週間前にブックマークしました:

http://jeanphix.me/Ghost.py/

これはPythonWebkitクライアントです。基本的に、数行のコードでページから必要なものを引き出すことができます。

于 2012-08-16T03:12:42.440 に答える