日付を取得しようとしている Web ページがあります。私はフォーマットが何であるかを知っているので、解決策は と同じくらい簡単なはずですtime.strptime(format)
が、問題はこれです:
If string cannot be parsed according to format, or if it has excess data after parsing, ValueError is raised.
私は次のようなものを解析しようとしています:
<tr><td align="center"><b>Create time</b></td>
</tr><tr><td align="center" bgcolor="#DDDDDD">Between August 1, 2012, 8:05 pm and August 1, 2012, 8:06 pm</td>
対応する形式は次のようになります%B %d, %Y
(実際には日付は関係ありません。日付が必要なだけです)。
正規表現 (例: ([JFMASOND][a-z]{2,8}) ([0-9]{1,2}), ([0-9]{4})
) を使用して文字列の関連部分を取得することもできますが、正規表現から値自体を取得し、必要な変換を自分で行うこともできます。いわば、コンテナ文字列で strptime を使用する方法はありますか? strptime がフォーマットが一致するまで文字列を処理し続けるのはそれほど難しくないはずです...
(自分でやらなければならない場合、正規表現よりも良い方法はありますか?)