Word文書を「フィルターされたHTML」として保存するスクリプトVBSまたはRubyがありますが、エンコードパラメーターは無視されます。HTMLファイルは常にWindows-1252でエンコードされます。Windows7SP1でWord2007SP3を使用しています。
Rubyの例:
require 'win32ole'
word = WIN32OLE.new('Word.Application')
word.visible = false
word_document = word.documents.open('C:\whatever.doc')
word_document.saveas({'FileName' => 'C:\whatever.html', 'FileFormat' => 10, 'Encoding' => 65001})
word_document.close()
word.quit
VBSの例:
Option Explicit
Dim MyWord
Dim MyDoc
Set MyWord = CreateObject("Word.Application")
MyWord.Visible = False
Set MyDoc = MyWord.Documents.Open("C:\whatever.doc")
MyDoc.SaveAs "C:\whatever2.html", 10, , , , , , , , , , 65001
MyDoc.Close
MyWord.Quit
Set MyDoc = Nothing
Set MyWord = Nothing
ドキュメンテーション:
Document.SaveAs: http: //msdn.microsoft.com/en-us/library/bb221597.aspx
msoEncodingの値:http ://msdn.microsoft.com/en-us/library/office/aa432511(v = office.12).aspx
WordにHTMLファイルをUTF-8で保存させる方法についての提案はありますか?