私は、Web ページからデータを引き出す簡単な方法について、rubyforge の XML および HTML ライブラリーを調べてきました。たとえば、stackoverflow でユーザー ページを解析したい場合、どうすればデータを使用可能な形式に変換できますか?
自分のユーザー ページを解析して、現在の評判スコアとバッジ リストを取得したいとします。ユーザー ページから取得したソースを xml に変換しようとしましたが、div がないために変換に失敗しました。文字列を比較して探しているテキストを見つけることができることはわかっていますが、これを行うにはもっと良い方法が必要です。
これを、コマンド ラインでユーザー データを吐き出す単純なスクリプトに組み込み、場合によってはそれを GUI アプリケーションに拡張したいと考えています。