特別にフォーマットされたドキュメントからファイル名を取り出してリストに入れようとしています。ドキュメントには大量の情報が含まれていますが、私が気になる行は次のような行で、常に行頭に「ファイル名:」があります。
File Name: C:\windows\system32\cmd.exe
私は次のことを試しました:
xmlfile = open('my_file.xml', 'r')
filetext = xmlfile.read()
file_list = []
file_list.append(re.findall(r'\bFile Name:\s+.*\\.*(?=\n)', filetext))
これはfile_list
次のようになります。
[['File Name: c:\\windows\\system32\\file1.exe',
'File Name: c:\\windows\\system32\\file2.exe',
'File Name: c:\\windows\\system32\\file3.exe']]
私は出力が単純になるように探しています:
(file1.exe, file2.exe, file3.exe)
上記の出力でも使用ntpath.basename
してみましたが、リストではなく文字列を入力として使用したいようです。
私はPythonとスクリプト全般に非常に慣れていないので、提案をいただければ幸いです。