Microsoft Word をインストールせずに、単純な HTML ページを Word (.docx ではなく .doc 形式) にエクスポートする方法はありますか?
11 に答える
おっしゃる通り単純な HTML ページしかない場合は、Word で開くことができます。
そうでなければ、これを行うことができるライブラリがいくつかありますが、私はそれらの経験がありません。
私の最後の考えは、ASP.NET を使用している場合application/msword
、ヘッダーに追加してみて、それを Word 文書として保存できるということです (実際の Word 文書ではなく、doc
開くことができるように名前が変更された HTML のみです) 。 .
オープン オフィスに接続してファイル フォーマット コンバーターを公開する JODConverter というツールがあります。投稿先の webapp (tomcat にある) として利用できるバージョンと、コマンド ライン ツールがあります。私はそれでhtmlを発射し、.docとpdfに正常に変換しました。これはかなり大きなプロジェクトにあり、まだ稼働していませんが、使用する予定です。 http://sourceforge.net/projects/jodconverter/
HTMLtoWordと呼ばれるオープン ソース プロジェクトがあり、ユーザーは整形式の HTML (XHTML) のフラグメントを書式設定されたテキストとして Word 文書に挿入できます。
Java で作業している場合は、私がdocx4j 2.8.0でリリースしたコードを使用して、HTML を実際の docx コンテンツに変換できます。私が「本当の」と言ったのは、代わりに HTML altChunkを作成することであり、Word に依存して実際の変換を行うためです (ドキュメントが最初に開かれたとき)。
ConvertInXHTML というプレフィックスが付いたさまざまなサンプルを参照してください。インポート プロセスでは整形式の XML が想定されるため、最初に整理する必要がある場合があります。
「.doc」Microsoft Word ファイルを作成することは可能ですが、「.rtf」ファイルを作成する方がおそらく簡単で移植性が高いでしょう。
まあ、これには多くのサードパーティツールがあります。それよりも簡単になるかどうかはわかりません。
例:
- http://htmltortf.com/
- http://www.brothersoft.com/windows-html-to-word-2008-56150.html
- http://www.eprintdriver.com/to_word/HTML_to_Word_Doc.html
vbscribtも見つかりましたが、ワードがインストールされている必要があると思います。
「C#」タグから、プログラムでこれを実現したいと思います。
Aspose.Words for .NET をお試しください。
HTML だけの場合は、拡張子を .doc に変更するだけで、Word 文書のように開きます。ただし、含める画像や実行する JavaScript がある場合は、もう少し複雑になる可能性があります。
Open Office は.htmlファイルを開くことも .doc ファイルを作成することもできると思います
Libreoffice Writerで html ファイルを開くことができます。その後、[ファイル] メニューから PDF としてエクスポートできます。また、ブラウザーは html を PDF ファイルとしてエクスポートできます。