39

私は(まったく運がなくても)グーグルで検索しましたopen source software that can convert doc, ppt, and pdf to HTML5.(正確にScribdが行うこと)Scribdが行う変換のタイプに相当するオープンソースはありますか?

誰かが有料サービスを知っていれば、それもうまくいくでしょう. Scribd にはAPIがありますが、これは Flash ビューアーで使用するためのものです。また、変換された html ドキュメントをさらに制御する必要があるため、独自のコンテンツをホストしたいと考えています。

4

6 に答える 6

15

特にオープンソースの世界では、これをすべて行う単一の製品を見つけることはまずありません。寄せ集めのものに頼ることになる可能性が高く、HTML に到達するためにいくつかのコンバーターを連鎖させる必要さえあるかもしれません。(例: PDF -> ps -> HTML)

OpenOffice は HTML への変換をサポートしており、コマンド ラインから呼び出すことができます。

http://pdftohtml.sourceforge.net/は、pdf を html に変換するのにかなり適しているようです。

Word ML または OpenXML 形式の Doc の場合、入力形式と出力形式の両方が XML であるため、XSLT 変換を使用できると考えられます。これを行うスタイルシートがネットに出回っているのを見たことがありますが、YMMV.

ところで、なぜオープンソースに特定の要件があるのですか? たとえば、MS Powerpoint は既に HTML として保存をサポートしています。

于 2010-09-03T07:15:54.287 に答える
5

Open Office は pdf を html に変換しますが、デザインの品質が低下します。

有料サービスとしてのCrocodoc ( Python、Ruby、Java、PHPなどのさまざまなプラットフォームにさまざまなフレーバーを提供します。開発者は API で作業することが許可されています) か、公式の Adob​​e ツールを待つ (開発中)

于 2011-02-18T21:42:46.733 に答える
3

PDF から HTML への変換の場合、pdf2htmlEX は非常に優れたツールのようです (すべての例/サンプルを見てください)。

https://github.com/coolwanglu/pdf2htmlEX

于 2013-10-02T20:56:31.453 に答える
1

http://wvware.sourceforge.net/

wvHtml:Word文書をHTML4.0に変換します。

おそらく: http ://www.abisource.com/です が、この場合は手動で「opendoc」>「exporthtml」のように見えます。プラグインが役立つかもしれません。わからない、どういう意味ですか:「変換できるソースソフトウェア」。

またはこれ: http ://www.zope.org/Members/sf/NuxDocument

また、pdftohtmlはhtmlページの出力を提供しますが、グラフィカルインターフェイスで作業する必要があります。あまりインタラクティブではないようです。

于 2010-08-24T21:12:06.600 に答える
1

PDF については、mozilla によって開始されたオープン ソース プロジェクトがあり、非常に優れています: https://github.com/mozilla/pdf.js/

Hello World の例を見ることができます: https://github.com/mozilla/pdf.js/tree/master/examples/helloworld

残りのドキュメント タイプについては、LibreOffice が html5 で何かを構築する計画があると述べたと思いますが、これまでのところ何も行われていません。

于 2013-06-11T08:10:05.917 に答える