0

私は、MS Word(および場合によってはWebベースのリッチテキストエディターからの入力)ドキュメントを取得し、それらのドキュメントのフォームフィールドプレースホルダーに値を代入し、出力としてPCLドキュメントを生成する機能を含むWebアプリケーションを構築しています。

私はWindowsでPythonとdjangoで開発していますが、このソリューション全体をWebホストにデプロイする必要があります(まだ選択されていません)。つまり、実際には、ソリューションはLinuxで実行する必要があります。

それが唯一の方法である場合、私はLinuxのみのソリューションを受け入れています。私は、別の言語で書かれたサーバーと通信することを含むソリューションを受け入れています。これを行うために、必要に応じてC++またはJavaを作成できます。最終的な出力PCL形式である必要があります。

私の質問は、Pythonを使用してWord文書からPCLを生成するための優れたツールチェーンは何ですか?

私は、OpenOfficeに何らかのインターフェイスを使用して、単語のドキュメントを開き、置換を行い、出力をある種のプリンタードライバーに送信することを検討しています。誰かがこれを経験したことがありますか?どのライブラリをお勧めしますか?

私が特定したインターフェースのオプションには、次のものがあります。他の提案は大歓迎です:

2番目のアプローチは、paradocx(https://bitbucket.org/yougov/paradocx/wiki/Home)のようなものを使用して単語ファイルを開き、Pythonでそれを使用して置換を行い、PCLを出力できるものと何らかの方法でインターフェイスすることです。 。繰り返しになりますが、このアプローチに関する経験やコメントをいただければ幸いです。

ツールやツールチェーン、そしてあなたが持っているかもしれないアイデアやレシピについてのコメントをいただければ幸いです。

この質問は、MS WordからPCLファイルを作成する方法と同様の根拠をカバーしていますが、同じではありません。

4

2 に答える 2

2

GhostscriptはPS(Postscript)またはPDFを読み取って、PCLを作成できます。Pythonライブラリを使用することも、サブプロセスを使用することもできます。

于 2012-01-23T16:10:59.727 に答える
0

さて、私の最終的な解決策は、トランスコーディングを実行するためのJavaWebサービスを作成することでした。

  • Docx4jは、DocxをPDFに変換するためにapacheFOPorg.docx4j.convert.out.pdf.viaXSLFO.Conversionにフックするクラスを提供します。PCLに変換するために簡単にハッキングされる可能性があります(FOPはPCLを出力するため)
  • Sparkは軽量のJavaWebフレームワークであり、トランスコーダーをWebサービスでラップすることができました。
  • ドキュメントも操作するので、メタデータが必要です。完璧なのはマルチパートフォームです。ApacheFileuploadを使用してデコードします

ほとんどすべての場合、これを機能させるには、ライブラリの開発バージョンにアップグレードする必要がありました。

Python側では、次を使用します。

  • requestsWebサービスと通信する
  • posterマルチパートリクエストを準備する
于 2012-01-30T19:02:57.123 に答える