watir-webdriverを使用して、ネストされたテーブルベースのレイアウトのページからスクレイプしています。例として、私はhttp://veryslow.staticloud.com/に非常に小さなおもちゃのサイトを構築しました。ソ連とブラジルの要素を含む最も内側のテーブルを検索するには、次のコードを使用します。
require "rubygems"
require "watir-webdriver"
r = Watir::Browser.new
br.goto("http://veryslow.staticloud.com/")
reg = /USSR.+Brazil/m
mytable = br.table(:text,reg).table(:text,reg).table(:text,reg).table(:text,reg).table(:text, reg).table(:text, reg)
mytable.text
2つの質問があります:
- これらの内部テーブルを検索するためのより良い方法はありますか?
- なんでこんなに遅いの?実際にテーブルを見つけるには(私が電話したときに実行されます
mytable.text
)、かなりの時間がかかります。ネストされたテーブルベースのレイアウトを持つ複雑なWebサイトの場合、これは非常に長くなります。
ネストされたテーブルのデザインは悪い考えですが、それらから読み取る必要がある場合、それを行うためのより速い方法はありますか?