3

特定のファイルから場所と時刻を取得するために、ファイルをフィルター処理するプログラムを作成しました。各ファイルには 1 日分のツイートが含まれます。

このプログラムを 1 年分のツイートに対して実行したいと思います。これには、2011- - .tweets.dat.gz のような名前の 365 を超えるフォルダーを反復処理する必要があります。年の各日の日付。

基本的に、2011-01-01.tweets.dat.gz、2011-01-02.tweets.dat.gz、...、2011-12-31 をループするコードを探しています。 tweets.dat.gz.

私が今想像しているのは、プログラムに 2011-*.tweets.dat.gz という名前のすべてのファイルをループするように何らかの方法で指示することですが、それがどのように機能するか、どのように構造化するか、または* 構文は正しいです。

任意のヒント?

4

2 に答える 2

1

最も簡単な方法は、確かにグロブを使用することです:

import from glob import iglob

for pathname in iglob("/path/to/folder/2011-*.tweets.dat.gz"):
   print pathname   # or do whatever
于 2013-07-08T22:02:36.670 に答える