Windowsと*nixプラットフォームの改行が余分にあるという問題が発生しています。
file = open('UTF16file.xml', 'rb')
html = file.read().decode('utf-16')
file.close()
regexp = re.compile(self.originalurl, re.S)
(html, changes) = regexp.subn(self.newurl, html)
file = open('UTF16file-regexed.xml', 'w+')
file.write(html.encode('utf-16'))
file.close()
このコードをMacで実行すると、余分な改行なしでファイルが返されます。これまでに試しました:
正規表現をファイルをデコードする代わりにutf-16としてエンコードすると、WindowsとOSXで機能しなくなります。
「w+」の代わりに「wb」モードで書き込む-Windowsでは中断します。
何か案は?