問題タブ [docsplit]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - ドキュメントを PDF 形式に変換する効率的な方法
doc、docx、ppt、pptx などのドキュメントを pdf に変換する効率的な方法を見つけようとしています。これまでのところ、 docsplitとを試しましたが、どちらもサイズが 1.7MBのpptx ファイルoowriter
のジョブを完了するのに 10 秒以上かかりました。私のアプローチを改善するためのより良い方法や提案を誰かが私に提案できますか?
私が試したこと:
出力:
環境:
- Linux - Ubuntu 12.04
- パイソン 2.7.3
その他のツールの結果:
- jodconverterは 11.32 秒かかりました
ruby-on-rails - RailsでPPTを画像に変換する
docsplit gem を使用して PPT を画像に変換しています
正常に変換されますが、もっと時間がかかります。他の方法で変換できますか。誰か助けてください。
plone - Plone とドキュメントビューア
私はPloneに取り組んでいます。document-viewer のインストールに成功しました: アップロードされた pdf の非常に優れたプレビューが表示されます。
この問題は、ワールド ファイルと Excel ファイルのプレビューにあります。要件が示すように、その結果を得るには OpenOffice または LibreOffice をインストールする必要があります。
目標を達成するために私がしたこと:
ドキュメント ビューアーをテストするためにファイルをアップロードした後に受け取るエラー:
コードのこの部分 (DocSplit から、ドキュメント ビューアーの要件) を読むと、DocSplit が openoffice/libreoffice インストールの存在を (57 行目) でチェックしていることがわかります。
私の OpenOffice インストールは "/usr/lib64/openoffice.org" にあります。これが問題でしょうか?そうでない場合、これを解決するにはどうすればよいですか?
ruby-on-rails - そのようなファイルまたはディレクトリはありません @ rb_sysopen (Errno::ENOENT) - DOCSPLIT
Docsplit を使用して Microsoft Office Word 文書から画像を抽出しようとすると、次のエラーが返されます。
これはスクリプトです:
これは、transparent_pdfs の 22 行目です。
すべてのライブラリがインストールされたCentos 6を使用していますが、Mac Os Xでも同じようにうまく機能します。PDF を変換しようとするとうまくいきますが、Office ドキュメントでのみ失敗します。
何か案は?
ありがとう、
ruby - 複数ページの PDF をアップロードし、各ページを Paperclip で JPEG に変換する方法は?
Paperclip を使用して複数ページの PDF をアップロードし、各ページを JPEG に変換する方法を知っている人はいますか?
これまでのところ、PDF をアップロードするたびに、PDF の最初のページのみが JPEG として表示されます。しかし、PDF からすべてのページをアップロードして JPEG に変換できるようにしたいと考えています。
10 pg の PDF をアップロードし、データベースに 10 個の JPEG ファイルとして変換/保存するのに役立つ gem またはプラグインはありますか?
docsplit-images gemを見てきましたが、それが最善の解決策なのか、それがどのように機能するのかわかりません。
Post.rb
_form.html.erb
show.html.erb
ruby-on-rails - 画像付きドキュメント (.doc) を読み取る
ルビでドキュメントのテキストを読み、その内容に対していくつかの操作を実行する必要があります。これらのドキュメントの中には、サーバーにアップロードし、後で画像付きのデータを表示する必要がある画像が含まれているものがあります。どうすればこれを達成できるかについてのアイデアはありますか?
doc_ripper
/の使用を考えていますdocsplit
がripper
、画像の抽出については言及しておらずdocsplit
、ページ全体のスクリーンショットを撮るだけのようです。
これが不可能な場合は、画像ファイル名を正しい位置に復元する方法で問題ないので、ファイルを抽出して手動でアップロードできます。