辞書に入れる必要がある外部ファイルがあります。各記事は で始まり、<NEW DOCUMENT>
下の行から<newdoc>
他の<newdoc>
. これが私がこれまでに持っているものです。
for line in file2:
line = line.strip()
line_list = line.split()
if "NEW DOCUMENT" in line:
doc_num+=1
new_dict[doc_num] = line
print(new_dict)
ファイルはこんな感じ。
<NEW DOCUMENT>
Look on the bright
side of Life.
<NEW DOCUMENT>
look on the very, dark
side of the Moon