日付でソートされたディレクトリ内のすべてのファイルのリストを取得する最良の方法は何ですか? 変更]、pythonを使用して、Windowsマシンで?
18 に答える
ディレクトリ内の最後に更新されたファイルを決定するために、Pythonスクリプトに対して過去にこれを行いました。
import glob
import os
search_dir = "/mydir/"
# remove anything from the list that is not a file (directories, symlinks)
# thanks to J.F. Sebastion for pointing out that the requirement was a list
# of files (presumably not including directories)
files = list(filter(os.path.isfile, glob.glob(search_dir + "*")))
files.sort(key=lambda x: os.path.getmtime(x))
これは、ファイル mtime に基づいて探していることを行う必要があります。
編集: 必要に応じて、glob.glob() の代わりに os.listdir() を使用することもできます。元のコードで glob を使用した理由は、特定のセットを持つファイルのみを検索するために glob を使用したかったからです。 glob() の方が適しているファイル拡張子。listdir を使用するには、次のようになります。
import os
search_dir = "/mydir/"
os.chdir(search_dir)
files = filter(os.path.isfile, os.listdir(search_dir))
files = [os.path.join(search_dir, f) for f in files] # add path to each file
files.sort(key=lambda x: os.path.getmtime(x))
更新:dirpathのエントリを Python 3 の変更日で並べ替えるには:
import os
from pathlib import Path
paths = sorted(Path(dirpath).iterdir(), key=os.path.getmtime)
(可視性を高めるために、ここに@Pygirlの回答を入れてください)
filenames のリストが既にある場合files、Windows で作成時間順にソートするには (リストに絶対パスが含まれていることを確認してください):
files.sort(key=os.path.getctime)
たとえば、 @ Jay's answerglobに示されているように使用して取得できるファイルのリスト。
古い回答の回答
のより詳細なバージョンを次に示し@Greg Hewgillます。質問の要件に最も適合しています。作成日と変更日を区別します (少なくとも Windows では)。
#!/usr/bin/env python
from stat import S_ISREG, ST_CTIME, ST_MODE
import os, sys, time
# path to the directory (relative or absolute)
dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'
# get all entries in the directory w/ stats
entries = (os.path.join(dirpath, fn) for fn in os.listdir(dirpath))
entries = ((os.stat(path), path) for path in entries)
# leave only regular files, insert creation date
entries = ((stat[ST_CTIME], path)
for stat, path in entries if S_ISREG(stat[ST_MODE]))
#NOTE: on Windows `ST_CTIME` is a creation date
# but on Unix it could be something else
#NOTE: use `ST_MTIME` to sort by a modification date
for cdate, path in sorted(entries):
print time.ctime(cdate), os.path.basename(path)
例:
$ python stat_creation_date.py
Thu Feb 11 13:31:07 2009 stat_creation_date.py
os.path.getmtimeエポックからの秒数を与える関数があり、よりも高速である必要がありますos.stat。
import os
os.chdir(directory)
sorted(filter(os.path.isfile, os.listdir('.')), key=os.path.getmtime)
これが私のバージョンです:
def getfiles(dirpath):
a = [s for s in os.listdir(dirpath)
if os.path.isfile(os.path.join(dirpath, s))]
a.sort(key=lambda s: os.path.getmtime(os.path.join(dirpath, s)))
return a
まず、ファイル名のリストを作成します。isfile() は、ディレクトリをスキップするために使用されます。ディレクトリを含める必要がある場合は省略できます。次に、変更日をキーとして使用して、リストをその場で並べ替えます。
ここにワンライナーがあります:
import os
import time
from pprint import pprint
pprint([(x[0], time.ctime(x[1].st_ctime)) for x in sorted([(fn, os.stat(fn)) for fn in os.listdir(".")], key = lambda x: x[1].st_ctime)])
これは os.listdir() を呼び出してファイル名のリストを取得し、次に os.stat() を呼び出してファイル名ごとに作成時刻を取得し、作成時刻に対してソートします。
このメソッドは os.stat() をファイルごとに 1 回だけ呼び出すことに注意してください。これは、並べ替えの比較ごとに呼び出すよりも効率的です。
python 3.5 以降で
from pathlib import Path
sorted(Path('.').iterdir(), key=lambda f: f.stat().st_mtime)
特定の拡張子を持つファイルを日付順に読み取りたい場合は、フィルターなしで glob を使用した私の答えを次に示します (Python 3)。
dataset_path='/mydir/'
files = glob.glob(dataset_path+"/morepath/*.extension")
files.sort(key=os.path.getmtime)
sorted(filter(os.path.isfile, os.listdir('.')),
key=lambda p: os.stat(p).st_mtime)
os.walk('.').next()[-1]でフィルタリングする代わりに使用できますがos.path.isfile、リストに無効なシンボリックリンクが残り、os.stat失敗します。
これは学習の基本的なステップです。
import os, stat, sys
import time
dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'
listdir = os.listdir(dirpath)
for i in listdir:
os.chdir(dirpath)
data_001 = os.path.realpath(i)
listdir_stat1 = os.stat(data_001)
listdir_stat2 = ((os.stat(data_001), data_001))
print time.ctime(listdir_stat1.st_ctime), data_001
おそらく、シェルコマンドを使用する必要があります。Unix/Linux では、find piped with sort でおそらくやりたいことができるでしょう。