プログラムでMicrosoftWord文書をXHTMLに変換したいと思います。選択する言語はPHPなので、PHPに関する提案をいただければ幸いです。
最初のアイデアは、docファイルをodtに変換してから、Odt2XhtmlPHPクラスを使用してXHTML形式に変換することです。
これを行うためのより良い方法はありますか?
プログラムでMicrosoftWord文書をXHTMLに変換したいと思います。選択する言語はPHPなので、PHPに関する提案をいただければ幸いです。
最初のアイデアは、docファイルをodtに変換してから、Odt2XhtmlPHPクラスを使用してXHTML形式に変換することです。
これを行うためのより良い方法はありますか?
Linux を実行している場合、サーバーに OpenOffice をインストールするのが 1 つの方法です。
「ヘッドレス」(つまり、UI なし) インストールの手順の例については、こちらを参照してください。
その後、shell_exec を介して実行されるunoconvなどの優れた CLI アプリを使用して、PHP を介して変換を行うことができます。
最も確実な方法は、COM を使用して Word でドキュメントを HTML として保存することです。
Word が XHTML を直接生成できるかどうかはわかりません。そうでない場合、Google はその変換を行うための多くのオプションを示します。
phpLiveDocxは、MicrosoftWord文書を変換するための非常に簡単な方法を提供します。
プロジェクトのWebサイトで詳細をご覧ください。
phpLiveDocxを使用して、テキストデータをMS Wordテンプレートとマージし、結果のドキュメントをDOC、DOCX、RTF、PDF、またはTXTに保存することもできます。
このコンポーネントはエンタープライズ対応であり、ZendFramework用に作成されています。
適応できる XSLT を含むhttp://www.codeplex.com/OpenXMLViewerを参照してください。これは私が docx4j で行ったことです。ただし、XSLT は気弱な人向けではないことに注意してください。