ウィクショナリーのエントリを解析して、すべての英語の定義を取得しようとしています。すべての定義を取得できますが、問題は、一部の定義が他の言語であるということです。私がやりたいことは、どういうわけか英語の定義を持つ HTML ブロックだけを取得することです。他の言語エントリがある場合、英語の定義の後のヘッダーを次のように取得できることがわかりました。
header = (doc/"h2")[3]
したがって、このヘッダー要素の前のすべての要素のみを検索したいと思います。で可能かもしれないと思ったheader.preceding_siblings()
のですが、うまくいかないようです。助言がありますか?