7

たとえば、日付のリストがあります。

['2011-02-27', '2011-02-28', '2011-03-01', '2011-04-12', '2011-04-13', '2011-06-08']

これらの日付に含まれる連続した日付範囲を見つけるにはどうすればよいですか? 上記の例では、範囲は次のようになります。

[{"start_date": '2011-02-27', "end_date": '2011-03-01'},
 {"start_date": '2011-04-12', "end_date": '2011-04-13'},
 {"start_date": '2011-06-08', "end_date": '2011-06-08'}
]

ありがとう。

4

5 に答える 5

10

これは機能し、しかし、私はそれに満足していません。よりクリーンなソリューションに取り組み、回答を編集します. 完了しました。これはクリーンで実用的なソリューションです。

import datetime
import pprint

def parse(date):
    return datetime.date(*[int(i) for i in date.split('-')])

def get_ranges(dates):
    while dates:
        end = 1
        try:
            while dates[end] - dates[end - 1] == datetime.timedelta(days=1):
                end += 1
        except IndexError:
            pass

        yield {
            'start-date': dates[0],
            'end-date': dates[end-1]
        }
        dates = dates[end:]

dates = [
    '2011-02-27', '2011-02-28', '2011-03-01',
    '2011-04-12', '2011-04-13',
    '2011-06-08'
]

# Parse each date and convert it to a date object. Also ensure the dates
# are sorted, you can remove 'sorted' if you don't need it
dates = sorted([parse(d) for d in dates]) 

pprint.pprint(list(get_ranges(dates)))

そして相対出力:

[{'end-date': datetime.date(2011, 3, 1),
  'start-date': datetime.date(2011, 2, 27)},
 {'end-date': datetime.date(2011, 4, 13),
  'start-date': datetime.date(2011, 4, 12)},
 {'end-date': datetime.date(2011, 6, 8),
  'start-date': datetime.date(2011, 6, 8)}]
于 2011-08-03T22:52:18.910 に答える
0

忍者GaretJaxの編集を試みています: ;)

def date_to_number(date):
  return datetime.date(*[int(i) for i in date.split('-')]).toordinal()

def number_to_date(number):
  return datetime.date.fromordinal(number).strftime('%Y-%m-%d')

def day_ranges(dates):
  day_numbers = set(date_to_number(d) for d in dates)
  start = None
  # We loop including one element guaranteed not to be in the set, to force the
  # closing of any range that's currently open.
  for n in xrange(min(day_numbers), max(day_numbers) + 2):
    if start == None:
      if n in day_numbers: start = n
    else:
      if n not in day_numbers: 
        yield {
          'start_date': number_to_date(start),
          'end_date': number_to_date(n - 1)
        }
        start = None

list(
  day_ranges([
    '2011-02-27', '2011-02-28', '2011-03-01',
    '2011-04-12', '2011-04-13', '2011-06-08'
  ])
)
于 2011-08-03T23:08:28.547 に答える
0
from datetime import datetime, timedelta

dates = ['2011-02-27', '2011-02-28', '2011-03-01', '2011-04-12', '2011-04-13', '2011-06-08']
d = [datetime.strptime(date, '%Y-%m-%d') for date in dates]
test = lambda x: x[1] - x[0] != timedelta(1)
slices = [0] + [i+1 for i, x in enumerate(zip(d, d[1:])) if test(x)] + [len(dates)]
ranges = [{"start_date": dates[s], "end_date": dates[e-1]} for s, e in zip(slices, slices[1:])]

結果は次のとおりです。

>>> pprint.pprint(ranges)
[{'end_date': '2011-03-01', 'start_date': '2011-02-27'},
 {'end_date': '2011-04-13', 'start_date': '2011-04-12'},
 {'end_date': '2011-06-08', 'start_date': '2011-06-08'}]

slicesリスト内包表記は、前の日付が現在の日付の 1 日前ではないすべてのインデックスを取得します。0先頭と末尾に追加するlen(dates)と、日付の各範囲は として記述できますdates[slices[i]:slices[i+1]-1]

于 2011-08-03T23:11:50.953 に答える
0

別の解決策は次のとおりです。これは、(start,finish) のリスト タプルを返します。

これによりリストが変更されるため、コピーを作成する必要がありました。明らかに、メモリ使用量が増加します。list.pop() は超効率的ではないと思いますが、それはおそらく Python での list の実装に依存しています。

def collapse_dates(date_list):
    if not date_list:
        return date_list
    result = []
    # We are going to alter the list, so create a (sorted) copy.
    date_list = sorted(date_list)
    while len(date_list):
        # Grab the first item: this is both the start and end of the range.
        start = current = date_list.pop(0)
        # While the first item in the list is the next day, pop that and
        # set it to the end of the range.
        while len(date_list) and date_list[0] == current + datetime.timedelta(1):
            current = date_list.pop(0)
        # That's a completed range.
        result.append((start,current))

    return result

追加行を簡単に変更して、辞書に追加するか、リストに追加する代わりに譲ることができます。

ああ、私はそれらがすでに日付であると想定しています。

于 2011-09-21T01:29:59.583 に答える