ページをスクレイピングして解析したい場合は、jsdom でノードを使用することをお勧めします。
nodeJS をインストールします (Linux を想定):
sudo apt-get install git
cd ~
git clone git://github.com/joyent/node
cd node
git checkout v0.6
mkdir ~/.local # If it doesn't already exist
./configure --prefix=~/.local
make
make install
Windows インストーラーもあります: http://nodejs.org/dist/v0.6.6/node-v0.6.6.msi
jsdom をインストールします。
$ npm install jsdom
URL と関連するセレクターで変更されたこのスクリプトを実行します。
var jsdom = require('jsdom');
jsdom.env({
html: 'url',
done: function(errors, window) {
console.log(window.document.getElementById('foo').textContent;
}
});