私はそのような構造を持つtxtファイルにそのようなエントリを持っています:
Some sentence.
Some other "other" sentence.
Some other smth "other" sentence.
原文:
Камиш-Бурунський залізорудний комбінат
Відкрите акціонерне товариство "Кар'єр мармуровий"
Закрите акціонерне товариство "Кар'єр мармуровий"
" の前にすべてを抽出し、別のファイルに書き込みたい。結果を次のようにしたい:
Some other
Some other smth
Відкрите акціонерне товариство
Закрите акціонерне товариство
私はこれをしました:
f=codecs.open('organization.txt','r+','utf-8')
text=f.read()
words_sp=text.split()
for line in text:
before_keyword, after_keyword = line.split(u'"',1)
before_word=before_keyword.split()[0]
encoded=before_word.encode('cp1251')
print encoded
しかし、 "を持たないファイル行があるため、機能しません。コードを改善して機能させるにはどうすればよいですか?