私は、Watir、Nokogir、および Hpricot を使用して実験を行っています。これらはすべて、私の問題であるトップダウンアプローチを使用しています。つまり、要素タイプを使用して要素を検索します。要素の種類を知らずに、テキストを使用して要素を見つけたい。例えば
<element1>
<element2> Text2 </element2>
<element3> Text3 </element3>
text4
</element1>
私が欲しいのは、Text2とText3を検索して、element2とelement1などを取得することです。
要素が div なのか、tr/tds なのか、リンクなのか、私にはわからないことに注意してください。私はテキストだけを知っています。アルゴリズムは次のようにする必要があります。すべての要素を反復処理し、内部テキストに一致し、一致する場合は要素と親要素を取得します。
これが何らかの方法で可能かどうか教えてください。