1

ファイル名のリストが特定のパターンに一致するかどうか、およびそのパターンから欠落しているファイルを判断する関数を Python で作成するにはどうすればよいですか? 例えば:

入力 ->

KUMAR.3.txt
KUMAR.4.txt
KUMAR.6.txt
KUMAR.7.txt
KUMAR.9.txt
KUMAR.10.txt
KUMAR.11.txt
KUMAR.13.txt
KUMAR.15.txt
KUMAR.16.txt

望ましい出力 -->

KUMAR.5.txt
KUMAR.8.txt
KUMAR.12.txt
KUMAR.14.txt

入力 -->

KUMAR3.txt
KUMAR4.txt
KUMAR6.txt
KUMAR7.txt
KUMAR9.txt
KUMAR10.txt
KUMAR11.txt
KUMAR13.txt
KUMAR15.txt
KUMAR16.txt

望ましい出力 -->

KUMAR5.txt
KUMAR8.txt
KUMAR12.txt
KUMAR14.txt
4

2 に答える 2

2

あなたはこれに次のようにアプローチすることができます:

  1. ファイル名を適切な整数に変換します。
  2. 不足している番号を見つけます。
  3. 欠落している番号を出力としてファイル名テンプレートと組み合わせます。

(1)の場合、ファイル構造が予測可能であれば、これは簡単です。

def to_num(s, start=6):
    return int(s[start:s.index('.txt')])

与えられた:

lst = ['KUMAR.3.txt', 'KUMAR.4.txt', 'KUMAR.6.txt', 'KUMAR.7.txt',
       'KUMAR.9.txt', 'KUMAR.10.txt', 'KUMAR.11.txt', 'KUMAR.13.txt',
       'KUMAR.15.txt', 'KUMAR.16.txt']

既知の番号のリストは、次の方法で取得できますmap(to_num, lst)。もちろん、ギャップを探すには、実際には最小値と最大値だけが必要です。それを関数と組み合わせると、range表示されるはずのすべての数値を取得してから、取得した数値を削除します。セットはここで役に立ちます。

def find_gaps(int_list):
    return sorted(set(range(min(int_list), max(int_list))) - set(int_list))

すべてを一緒に入れて:

missing = find_gaps(map(to_num, lst))
for i in missing:
    print 'KUMAR.%d.txt' % i
于 2009-04-15T02:59:26.710 に答える
1

パターンが比較的静的であると仮定すると、これは正規表現で十分に簡単です:

import re

inlist = "KUMAR.3.txt KUMAR.4.txt KUMAR.6.txt KUMAR.7.txt KUMAR.9.txt KUMAR.10.txt KUMAR.11.txt KUMAR.13.txt KUMAR.15.txt KUMAR.16.txt".split()

def get_count(s):
    return int(re.match('.*\.(\d+)\..*', s).groups()[0])

mincount = get_count(inlist[0])
maxcount = get_count(inlist[-1])
values = set(map(get_count, inlist))
for ii in range (mincount, maxcount):
    if ii not in values:
        print 'KUMAR.%d.txt' % ii
于 2009-04-15T02:46:38.427 に答える