現在、プログラミングの問題を解決しようとしています。HTML ページで繰り返し構造を見つけようとしており、それらの要素の値を取得しようとしています。
たとえば、次のような繰り返し要素を含む HTML ページがあります。
<html>
<body>
<ul>
<li>green</li>
<li>orange</li>
<li>red</li>
</ul>
</body>
このコードでは、繰り返しブロック (「li」項目) があることを検出し、それらの値を抽出したいと考えています。別の HTML の例:
<table>
<tr>
<td>1</td>
<td>John</td>
</tr>
<tr>
<td>2</td>
<td>Simon</td>
</tr>
</table>
この例では、構造が繰り返されていることを検出し、そこから値 [1,John] と [2,Simon] を取得したいと考えています。
私の質問は次のとおりです。このようなことを行うための単純なアルゴリズムはありますか、そうでない場合、このようなことにどのようにアプローチしますか?