文字列を。に解析する必要がある関数を書いていますtimedelta
。ユーザーは、"32m"
または"2h32m"
、または"4:13"
のようなものを入力する必要があり"5hr34m56s"
ます...この種のものがすでに実装されているライブラリまたは何かがありますか?
11 に答える
私にとって最も洗練された解決策は、dateutilなどの外部ライブラリに頼ったり、入力を手動で解析したりすることなく、 datetimeの強力なstrptime
文字列解析メソッドを使用することです。
from datetime import datetime, timedelta
# we specify the input and the format...
t = datetime.strptime("05:20:25","%H:%M:%S")
# ...and use datetime's hour, min and sec properties to build a timedelta
delta = timedelta(hours=t.hour, minutes=t.minute, seconds=t.second)
この後、timedeltaオブジェクトを通常どおりに使用し、秒に変換して、正しい処理が行われたことを確認します。
print(delta)
assert(5*60*60+20*60+25 == delta.total_seconds())
昨日は少し時間があったので、@ virhiloの回答をPythonモジュールに開発し、 @priestcから要求されたものを含むいくつかの時間式形式を追加しました。
ソースコードは、必要な人のためにgithub(MITライセンス)にあります。PyPIにもあります:
pip install pytimeparse
時間を秒数として返します。
>>> from pytimeparse.timeparse import timeparse
>>> timeparse('32m')
1920
>>> timeparse('2h32m')
9120
>>> timeparse('4:13')
253
>>> timeparse('5hr34m56s')
20096
>>> timeparse('1.2 minutes')
72
最初の形式(5hr34m56s
)の場合、正規表現を使用して解析する必要があります
これがリベースのソリューションです。
import re
from datetime import timedelta
regex = re.compile(r'((?P<hours>\d+?)hr)?((?P<minutes>\d+?)m)?((?P<seconds>\d+?)s)?')
def parse_time(time_str):
parts = regex.match(time_str)
if not parts:
return
parts = parts.groupdict()
time_params = {}
for name, param in parts.items():
if param:
time_params[name] = int(param)
return timedelta(**time_params)
>>> from parse_time import parse_time
>>> parse_time('12hr')
datetime.timedelta(0, 43200)
>>> parse_time('12hr5m10s')
datetime.timedelta(0, 43510)
>>> parse_time('12hr10s')
datetime.timedelta(0, 43210)
>>> parse_time('10s')
datetime.timedelta(0, 10)
>>>
時間を入力して、それをさまざまな日付に追加したかったので、これでうまくいきました。
from datetime import datetime as dtt
time_only = dtt.strptime('15:30', "%H:%M") - dtt.strptime("00:00", "%H:%M")
いくつかのアップグレードでvirhiloの良い答えを変更しました:
- 文字列が有効な時間文字列であるというアサーションを追加しました
- 「hr」時間インジケーターを「h」に置き換えます
- 「d」を考慮してください-日インジケーター
- 整数以外の時間を許可します(たとえば
3m0.25s
、3分、0.25秒)
。
import re
from datetime import timedelta
regex = re.compile(r'^((?P<days>[\.\d]+?)d)?((?P<hours>[\.\d]+?)h)?((?P<minutes>[\.\d]+?)m)?((?P<seconds>[\.\d]+?)s)?$')
def parse_time(time_str):
"""
Parse a time string e.g. (2h13m) into a timedelta object.
Modified from virhilo's answer at https://stackoverflow.com/a/4628148/851699
:param time_str: A string identifying a duration. (eg. 2h13m)
:return datetime.timedelta: A datetime.timedelta object
"""
parts = regex.match(time_str)
assert parts is not None, "Could not parse any time information from '{}'. Examples of valid strings: '8h', '2d8h5m20s', '2m4s'".format(time_str)
time_params = {name: float(param) for name, param in parts.groupdict().items() if param}
return timedelta(**time_params)
Djangoにはユーティリティ関数が付属していますparse_duration()
。ドキュメントから:
文字列を解析し、を返します
datetime.timedelta
。
"DD HH:MM:SS.uuuuuu"
ISO 8601(たとえばP4DT1H15M20S
、と同等4 1:15:20
)またはPostgreSQLの日中間隔形式(たとえば)で指定された形式またはデータを想定しています3 days 04:05:06
。
:を区切り文字として使用する場合は、次の関数を使用します。
import re
from datetime import timedelta
def timedelta_parse(value):
"""
convert input string to timedelta
"""
value = re.sub(r"[^0-9:]", "", value)
if not value:
return
return timedelta(**{key:float(val)
for val, key in zip(value.split(":")[::-1],
("seconds", "minutes", "hours", "days"))
})
例:
In [4]: timedelta_pars("1:0:0:1")
Out[4]: datetime.timedelta(days=1, seconds=1)
In [5]: timedelta_pars("123.5")
Out[5]: datetime.timedelta(seconds=123, microseconds=500000)
In [6]: timedelta_pars("1:6:34:9.983")
Out[6]: datetime.timedelta(days=1, seconds=23649, microseconds=983000)
In [8]: timedelta_pars("23:45:00")
Out[8]: datetime.timedelta(seconds=85500)
isodateライブラリを使用して、ISO8601期間文字列を解析します。例えば:
isodate.parse_duration('PT1H5M26S')
ISO 8601の期間をtimedeltaに変換する簡単な方法はありますか?も参照してください。
Pandasがすでに依存関係にある場合、これはかなりうまくいきます。
>>> import pandas as pd
>>> pd.Timedelta('5hr34m56s')
Timedelta('0 days 05:34:56')
>>> pd.Timedelta('2h32m')
Timedelta('0 days 02:32:00')
>>> pd.Timedelta('5hr34m56s')
Timedelta('0 days 05:34:56')
>>> # It is pretty forgiving:
>>> pd.Timedelta('2 days 24:30:00 10 sec')
Timedelta('3 days 00:30:10')
datetime.timedelta
そのタイプを好む場合に変換するには:
>>> pd.Timedelta('1 days').to_pytimedelta()
datetime.timedelta(1)
残念ながら、これは機能しません。
>>> pd.Timedelta('4:13')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "pandas\_libs\tslibs\timedeltas.pyx", line 1217, in
pandas._libs.tslibs.timedeltas.Timedelta.__new__
File "pandas\_libs\tslibs\timedeltas.pyx", line 454, in
pandas._libs.tslibs.timedeltas.parse_timedelta_string
ValueError: expected hh:mm:ss format
Pandasには、それが主な目的ではありませんが、実際にはかなり広範な日付と時刻のツールがあります。
パンダをインストールするには:
# If you use pip
pip install pandas
# If you use conda
conda install pandas
Python 3を使用している場合は、HariShankarのソリューションの更新バージョンを次に示します。これは私が使用したものです。
from datetime import timedelta
import re
regex = re.compile(r'(?P<hours>\d+?)/'
r'(?P<minutes>\d+?)/'
r'(?P<seconds>\d+?)$')
def parse_time(time_str):
parts = regex.match(time_str)
if not parts:
return
parts = parts.groupdict()
print(parts)
time_params = {}
for name, param in parts.items():
if param:
time_params[name] = int(param)
return timedelta(**time_params)
tempora.parse_timedeltaを試すことを検討してください。
$ pip-run 'tempora>=4.1.1'
Collecting tempora>=4.1.1
Downloading tempora-4.1.1-py3-none-any.whl (15 kB)
Collecting jaraco.functools>=1.20
Using cached jaraco.functools-3.3.0-py3-none-any.whl (6.8 kB)
Collecting pytz
Using cached pytz-2021.1-py2.py3-none-any.whl (510 kB)
Collecting more-itertools
Using cached more_itertools-8.8.0-py3-none-any.whl (48 kB)
Installing collected packages: more-itertools, pytz, jaraco.functools, tempora
Successfully installed jaraco.functools-3.3.0 more-itertools-8.8.0 pytz-2021.1 tempora-4.1.1
Python 3.9.2 (v3.9.2:1a79785e3e, Feb 19 2021, 09:06:10)
[Clang 6.0 (clang-600.0.57)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> from tempora import parse_timedelta
>>> parse_timedelta("32m")
datetime.timedelta(seconds=1920)
>>> parse_timedelta("2h32m")
datetime.timedelta(seconds=9120)
>>> parse_timedelta("4:13")
datetime.timedelta(seconds=15180)
>>> parse_timedelta("5hr34m56s")
datetime.timedelta(seconds=20096)