指定されたテキストブロックで始まり、特定のファイル拡張子(.txtなど)で終わる二重引用符で囲まれたテキストを返す正規表現が必要です。私はurllib2を使用してページのhtmlを取得しています(htmlは非常に単純です)。
基本的に私が次のようなものを持っている場合
<tr>
<td valign="top"><img src="/icons/unknown.gif" alt="[ ]"></td>
<td><a href="Client-8.txt">new_Client-8.txt</a></td>
<td align="right">27-Jun-2012 18:02 </td>
</tr>
それは私に戻るべきです
Client-8.txt
戻り値が二重引用符で囲まれている場合。ファイル名が「Client-」で始まり、ファイル拡張子が「.txt」である方法を知っています。
私はr.search(regex、string)で遊んでいます。ここで、入力する文字列はページのhtmlです。しかし、私は正規表現に悪臭を放ちます。
ありがとう!