このコードを使用して、Python の文字列から複数の日付を解析しようとしています。
from dateutil.parser import _timelex, parser
a = "Approve my leave from first half of 12/10/2012 to second half of 20/10/2012 "
p = parser()
info = p.info
def timetoken(token):
try:
float(token)
return True
except ValueError:
pass
return any(f(token) for f in (info.jump,info.weekday,info.month,info.hms,info.ampm,info.pertain,info.utczone,info.tzoffset))
def timesplit(input_string):
batch = []
for token in _timelex(input_string):
if timetoken(token):
if info.jump(token):
continue
batch.append(token)
else:
if batch:
yield " ".join(batch)
batch = []
if batch:
yield " ".join(batch)
for item in timesplit(a):
print "Found:", item
print "Parsed:", p.parse(item)
コードは文字列の後半を2番目の日付として取得しており、このエラーが発生しています。
raise ValueError, "unknown string format"
ValueError: unknown string format
「後半」を「後半」または「前半」に変更すると、すべて正常に動作します。
この文字列を解析するのを手伝ってくれる人はいますか?