Javaを使用してWord文書をPDFに変換しようとしています。「wordtoXSL-FOto pdf」は、私が見ているアプローチです。
'word to XSL-FO'を実行するこのアプローチでは、利用可能なオープンソースAPIはありますか?または、それを実装するための手順を教えていただけますか?
どのバージョンのWord文書を変換していますか?
RenderXには、MicrosoftのWordprocessingMLドキュメントをXSL FO(XSLFO)に変換できるWordML2FOスタイルシートが公開されています。
これらのスタイルシートは、RenderXの開発チームとMicrosoftが一般的な使用のために作成したものです。これらは、MicrosoftのWordprocessingML XMLボキャブラリのドキュメントをW3CのXSLFO(XSLFO)ボキャブラリのドキュメントに変換するために使用されます。
見逃すものが多すぎるため(スタイルの解決、docx/word2003ドキュメント内のグラフィックに使用されるdrawingml/vmlなど)、スタイルシートだけを使用することはできません。このコードサンプルを試して、そこから移動してください。また、MicrosoftのAPIを使用してWord 2003/2007を生成する場合、必要なすべての関数呼び出しを行わない限り、その構造が常に正しいとは限らないことにも注意してください。
docx4j(オープンソース、Apacheライセンス)がこれを実行できます。
詳細については、docx4jスタートガイドを参照してください。
OpenOfficeをどこかにインストールできる限り、DocmosisまたはJODConverterを試して変換を行うこともできます。これらは多くのプラットフォームで動作し、Javaで制御できます。