1

まず第一に、これは過去に何度も尋ねられた質問のように聞こえるかもしれないことに同意します. ただし、同様の質問で私に関連する回答が見つからなかったので、より具体的にしようと思います。

Python を使用して PPTX/DOCX ファイルを PDFに変換する必要がありますが、ファイル形式変換の経験はありません。私は多くの場所/フォーラム/ウェブサイトを調べ、多くのドキュメントを読み、いくつかの便利なライブラリ (主にpython-pptxpyPdf ) に出会いましたが、どこから始めればよいかまだわかりません。

インターネットを見ていると、ファイル形式の変換を有料サービスとして提供している Web サイトがたくさんあります。高度な API を使用しても、POST 経由でファイルを送信すると、変換された PDF ファイルが返されます。これはうまくいくかもしれませんが、OOXML から PDF への変換作業を行うコードを自分で書くことに本当に興味があります。

どうやってこれを始めますか?それとも自分だけでは無理ですか?

ご協力いただきありがとうございます!

4

1 に答える 1

2

いくつかの調査の後、python-pptx の作成者の助けを借りて、仮想マシンを使用して PowerPoint COM インターフェイスに書き込むことができました。

誰かがこのスレッドを読んだ場合、これが私がこれを成し遂げた方法です: - Microsoft Windows/Office がインストールされた VM をセットアップします。- Python、Django、および win32com ライブラリを VM にインストールします。

ファイルは、単純な POST 要求を介して、元の Django プロジェクトから仮想マシン (同じネットワーク上にある) にローカルに送信されます。ファイルは VM 上で win32com.client を使用して変換され (これは win32com.client ライブラリへの単純な呼び出しです)、元の Django ビューへの応答として送り返され、元の Django ビューが応答を処理します。

注: このセットアップを機能させるには @csrf_exempt デコレーターを使用する必要があることに気付くまでに少し時間がかかりました。

于 2013-08-30T12:37:08.320 に答える