Notepad++ を使用して、長くて乱雑な HTML テーブルをクリーンアップしています。また、正規表現を使用しようとしています。
特定の値を含まないすべてのテーブル行を削除する必要があります (その部分文字列と呼んでもよろしいですか?)。
すべてのファイルの内容をラップ解除した後、次の正規表現を使用して、すべての内容を含むすべてのテーブル行を 1 つずつ選択することができました。
<tr>.+?</tr>
substring<td>
を定義したテーブルの行の一部を含む行のみを選択して置き換えるために、正規表現を改善するにはどうすればよいですか?
これが問題になるかどうかはわかりませんが、すべてのテーブル行の構造は次のとおりです (すべての HTML タグを配置しました。ドットは標準のコンテンツ/値を表します)
<tr>
<td> ... </td>
<td> ... </td>
<td> <a sfref="..." href="...">!! SUBSTRING I HAVE TO MATCH HERE !!</a> </td>
<td> <img /> </td>
<td> ... </td>
<td> ... </td>
<td> ... </td>
<td> ... </td>
</tr>