doc/docx ファイルを html に変換しようとしていますが、見つけた最善の策はdocx4jです。この仕事をするための簡単なコマンドラインを教えてください。
私は試した:
java -cp docx4j.jar:log4j-1.2.15.jar org.docx4j.samples.CreateHtml [input.docx]
応答として、(コンソールまたはファイルへの) HTML 出力が期待されます。
http://dev.plutext.org/svn/docx4j/trunk/docx4j/docs/Docx4j_GettingStarted.htmlとサンプル dirを見て、私はそれを考えるだろう
java -cp docx4j.jar:log4j-1.2.15.jar org.docx4j.samples.CreateHtml [input.docx]
動作するはずです。[はじめに] > [コマンド ライン サンプル] セクションの次の点に注意してください。
docx に画像がある場合は、以下も必要です。
xmlgraphics-commons-1.4.jar commons-logging-1.1.1.jar
あなたのクラスパスに。
思考の線を提供してくれたaxに感謝しますが、そのコマンドはクラス欠落エラーを与えたので、パスに他のjarファイルを含めるためにすべてが必要でした。
java -cp docx4j-2.6.0.jar:log4j-1.2.15.jar:xalan-2.7.1.jar:serializer-2.7.1.jar:xml-apis-1.3.04.jar:commons-logging-1.1.1.jar:commons-lang-2.4.jar:commons-io-1.3.1.jar:commons-codec-1.3.jar:xmlgraphics-commons-1.4.jar org.docx4j.samples.CreateHtml input.doc