14

HTML テキストを RTF 文字列に変換する方法を探しています。この仕事をするライブラリはありますか。プロジェクトで HTML コンテンツを動的に取得し、RTF 形式でレンダリングする必要があります。HTML パーサーを使用して HTML テキストを通常の文字列に変換してから、PyRTF を使用して RTF 形式に変換しようとしています。これを行うことができるより良い方法はありますか?事前に感謝します.

4

3 に答える 3

3

RTF は、変換元/変換先が危険な形式のようです。たとえば、Mac OS X のアプリケーション間で切り取りと貼り付けを試みました。ここでは、RTF は共通語のようなものです。これらのアプリの一部は Microsoft アプリ (RTF は Microsoft が開発した形式であることに関連しています) ですが、そうでないものもあります。フォント サイズ、フォント フェイス、行間、リスト スタイル (順序付けされているかどうかに関係なく) などの基本的な書式設定情報でさえ、表向きは RTF を使用するアプリから別のアプリにコピーすると、ごちゃごちゃになります。簡単に言えば、それは混乱です。

できれば Python から、プログラムで RTF を読み取り、書き込み、変換する方法を探しました。PyPI でいくつかのパッケージを見つけましたが、それらを試してみるとがっかりしました。たとえば、現在のバージョンが 1.9.1 の場合、RTF 1.5 をサポートします。RTF はかなり前から存在していますが、2005 年のビンテージ仕様は最近のものではありません。多くの落とし穴と非互換性がありました。たくさん。

私は、それが不可能だと言っているのではありません。たとえば、ここで他の人が言及したことは試していません。zopyx.convertたぶんそれは素晴らしいです。しかし、その依存関係 (Java、FOP など) を見ると、かなり複雑な (したがって壊れやすい) ツールチェーンのように見えます。私は github でそのコードを読みましたが、Python は実際には調整ベニアとしてのみ存在します。XFC、XINC、FOP、PrinceXML という外部ツールがまとめられており、そのうち 4 つのうち 3 つが商用ソフトウェアです。これには、RTF を扱う主要な XFC 部分が含まれます。私に懐疑的な色を付けてください。

Mac を使用している場合、textutilコマンド ライン プログラムは、私が見たツールの中で、より優れたシンプルなツールの 1 つです。

textutil -convert html filename.rtf -output filename.html

検討する価値のある他の書式設定エンジンはLibreOfficeです。これは無料で、オープン ソースであり、合理的に自動化が可能であり、相互運用性ハブとしてのまともな基盤です。これは単なる推測ではありません。その周りに、複雑でマルチフォーマットのドキュメント ワークフローを構築しました。

なぜRTFに入ろうとしているのか疑問に思います。それは、あなたが逃げようとしている文書形式のようです。しかし、そこに行く必要がある場合、textutil と LibreOffice は、私が見つけた最も悪いメカニズムではありません。

于 2013-08-29T00:19:08.170 に答える
-1

tarball として提供されるすばらしい python ライブラリがあります。

https://pypi.python.org/pypi/zopyx.convert2/2.4.5でダウンロードできます。

幸運を!

于 2013-06-29T15:44:14.117 に答える