正規表現を使用してテーブル内のセルを照合しようとしていますが、問題はすべてのセルが同じパターンに従っていないことです。たとえば、td は次の形式を取る場合があります。
<td><a href="page101010.html">PageNumber</a></td>
またはこの形式:
<td align="left" ></td>
基本的に、td 内のハイパーリンク部分はすべてではなく、一部にのみ存在します。
以下のpython正規表現コードを使用してこの状況を照合しようとしましたが、失敗しました。
match = re.search(r'<td align="left" ><?a?.+\>?(.+)\<?\/?a?\>?\<\/td\>', tdlink)
上記の () で囲まれた部分を見つけるには、「一致」する必要があります。ただし、構文エラーまたは None Object メッセージが表示されます。
どこが間違っていますか?