そのため、さまざまな組織からの複数のファイルを読んでいます。すべてのファイルには、ファイル番号と編成があります。ファイルのリストを読んで、組織からそれらのものだけを見つけて、他のもの'OCE'
を無視しようとしています。'OCE'
私の目標は、合計でいくつのファイルが含まれているかを数え、それらのファイル番号を出力することです。
'OCE'
私の質問は、ファイルのみを選択して他の部分を無視したい部分をどのようにコーディングすればよいですか? どのステートメントを使用するかさえわかりません。どんな提案でも大歓迎です。
for filepath in matches[:20]:
with open (filepath,'rt') as mytext:
mytext=mytext.read()
# Find all files from 'OCE'.
grabOrg=re.findall(r'NSF\s+Org\s+\:\s+(OCE)',mytext)
if len(grabOrg) != 0:
OCEOrg=grabOrg[0] **# Here is my question.**
from collections import Counter
countOrg=Counter(OCEOrg)
print str(OCEOrg) + '|' + countOrg