JavaScriptを使用するページからURLを取得しようとしています。ページにリンクを表示する代わりにonClick
、いくつかのテーブル行のイベントを作成しました。これにより、行をクリックすると、リンクに移動します。
Mechanizeを使用してURLをスクレイピングしてみました。
agent = Mechanize.new
page = agent.get(url)
page.links_with(:href => /^http?/).each do |link|
puts link.href
end
onClick
ただし、HREF参照を介してリンクを検索することは、イベントの一部としてページ上にあるため、ここでは機能しません。
<tr onclick="window.open('/someurl');">
Mechanizeまたはその他のgemを使用して、ページ上のコードを解析し、onClick
イベントに埋め込まれたURLを抽出する良い方法はありますか?
すぐに使える優れたソリューションがない場合、それを行うための最良の正規表現は何でしょうか?私は正規表現に少し慣れていないので、まだ自分で何かをまとめることはできません。