問題タブ [docsplit]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ruby-on-rails - Ruby on RailsのDocsplit
Railsアプリでdocsplitを動作させようとしています。現在、ローカルで実行できるようにしようとしています。gem とすべての依存関係をインストールしました。基本的な例はすべてコマンド ラインで動作し、
私のレールアプリで動作します。ただし、extract_images を使用しようとすると、つまり
次のエラーが表示されます。
再確認したところ、すべての依存関係がインストールされています。Railsの構成で何かを見逃したと思います。
ありがとう。
ruby-on-rails - 複数ページの PDF をアップロードして Paperclip で JPEG に変換する方法は?
Paperclip を使用して複数ページの PDF をアップロードし、各ページを JPEG に変換する方法を知っている人はいますか?
これまでのところ、PDF をアップロードするたびに、PDF の最初のページのみが JPEG として表示されます。しかし、PDF からすべてのページをアップロードして JPEG に変換できるようにしたいと考えています。
10 pg の PDF をアップロードし、データベースに 10 個の JPEG ファイルとして変換/保存するのに役立つ gem またはプラグインはありますか?
docsplit-images gemを見てきましたが、それが最善の解決策なのか、それともどのように機能するのかわかりません。
Post.rb
_form.html.erb
show.html.erb
imagemagick - Ghoshscript エラー: エラー: /rangecheck in --.dicttomark--
ghoshscript を使用して pdf を画像に変換しようとしています。
PDF は次のとおりです。http://www.coppernet.zm/MPLS.pdf
私はこれを適用しようとしました: http://thomas-genin.com/ghostscript-convert-error-undefined-in-findresource/そしてそれはこのエラーを作成します。
編集:ファイルを削除する/var/lib/ghostscript/fonts/cidfmap
と、エラーはなくなりました。
fonts - docsplit(ghostscript)のCIDフォントを設定する方法は?
以下のURLにガイドリファレンスがあります。 http://www.ghostscript.com/doc/9.06/Use.htm#CIDFonts
しかし、私はそれを正しくフォローしていないと思います。
私がやろうとしているのは、Docsplitを使用してOfficeファイルを画像に変換することです。ただし、一部の文字(韓国語と中国語)は疑問符として表示されます。
私はそれがghostscriptと関係があると思いましたが、私はLinuxベースのソリューションに慣れていないので、苦労しました。
CIDフォントの設定方法に関するコマンドラインガイドを教えてもらえますか?
ruby - Ruby アプリケーションの使用中に remove_entry_secure エラーが発生する
docsplit を使用して PDF ファイルを画像に分割しようとしています。しかし、Ruby のインストールに問題があるようです。毎回次のエラーが発生し続けます。
完全なコマンドライン出力は次のとおりです。
これを修正する方法についてのアイデアはありますか?
ruby-on-rails - docsplit を使用してメモリ内のドキュメントからテキストを抽出する
docsplit gem を使用すると、PDF やその他のファイル タイプからテキストを抽出できます。たとえば、次の行を使用します。
PDFファイルのテキストコンテンツを持つことができます。
私は現在 Rails を使用しており、PDF はリクエストによって送信され、メモリ内に存在します。API とソース コードを調べたところ、ファイルからのみ、メモリからテキストを抽出する方法が見つかりませんでした。
一時ファイルの作成を回避して、この PDF のテキストを取得する方法はありますか?
気が向いたら使っ attachment_fu
ています。
ruby-on-rails - Railsでpdfからチェックボックスを解析する
PDF からチェックボックスを解析する必要があります。私はruby のDocksplit gemを使用しています。問題は、pdf が解析されると、そのテキストのみが解析され、チェックボックスが存在する兆候がないことです。
これは私のPDFチェックボックスのスクリーンショットです(クロス(X)でマークされたボックスがチェックされています)。
チェックされているかチェックされていないかを判断する方法はありますか.バイナリデータを使用している可能性がありますか?
ruby-on-rails - Docsplit は Rails 自体からではなく、コンソールから動作します
Docsplit の奇妙な問題を見つけようとしています。ユーザーがPPT/PDFをアップロードできるRails 2.3.14アプリケーションがあり、システムはDocsplitでカバー画像を抽出する必要があります。
次の行で、モデルへの after_save コールバックがあります。
この行により、次のエラーが生成されます。
これが Ghostscript に関連するバグであることはわかっていますが、コンソールからその正確なステートメントを手動で実行すると、すべて正常に動作します。それで、何ができますか?
pdf - PDF への docsplit 変換により、Linux の docx で非 ASCII 文字がマングルされる
私の文書管理アプリでは、ASCII 以外の Unicode 文字 (日本語) を含む .docx ファイルを、docsplit を使用して (必要に応じて Ruby gem を介して) PDF に変換しています。私のMacでは問題なく動作します。私の Ubuntu マシンでは、結果の PDF には、Ruby を介して呼び出された場合でも、コマンド ラインで直接呼び出された場合でも、文字が配置されるはずの場所に正方形のボックスが表示されます。奇妙なことに、.docx ファイルを LibreOffice で直接開いて PDF エクスポートを実行すると、正常に動作します。そのため、docsplit が LO を呼び出す方法には、Unicode 文字が不適切に処理される原因となる側面があるように思われます。指定する必要がある可能性のあるオプションについて、ドキュメントとコードのさまざまな部分を精査しましたが、うまくいきませんでした。なぜこれが起こっているのかについてのアイデアはありますか?
FWIW、docsplit は、次のオプション行で LO を呼び出しますpdf_extractor.rb
。
出力形式の後にオプションで出力フィルタ a in を付けることができることにpdf:output_filter_name
気付きました -- これは使用について考える必要がありますか?