問題タブ [pdf-to-html]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - PHPで使用できる長方形の領域からPDFからテキストを抽出するのに役立つライブラリはありますか?
左、上、幅、高さのパラメータで指定された指定された長方形の領域からPDFテキストを抽出するのに役立つ(できれば無料の)ライブラリを探しています。Linux システム上の PHP で使用できるはずです。そのようなライブラリと実用的な例を提案していただけますか?
php - PHP内でのシェルコマンドの実行
ターミナルでは、Webアプリケーションのディレクトリ内でこれを正常に実行します。
これをPHPで実行したいのでshell.sh
、次のようなファイルを作成しました。
それから私はこれをphpで書きました:
それは機能しません、私はhtmlファイルが生成されるのを見ることを期待しています、しかし私はいくつかの空のhtmlファイルを手に入れます..コマンドはターミナルを通してうまく働いたので、問題は私がphpからそれを実行する方法にあると思います
$ outputをエコーしても何も表示されません。何を間違えますか?
php - Pdftohtmlはオンラインサーバーでは機能しません
私はpdftohtmlを使用してpdfファイルを動的にhtmlファイルに変換しています。これはLinuxサーバー上のPHPを介して行います。
次のコードを使用して、PDFからHTMLへの変換をテストします。
は機能せず、echo $output
何も出力しませんが、などの他のLinuxコマンドは完全に正常に機能し、対応する出力を表示しますls
。make
奇妙なことに、まったく同じコードがubuntu 12.04のローカルホストのチャームのように機能し、htmlファイルが生成されshell_exec()
、ページ数やその他のものをログに記録することで出力が得られます。phpinfo()
Webサーバーのシステムによると:Linux infong 2.4#1 SMP
それを機能させる方法について何かアイデアはありますか?
pdf-to-html - Homebrew を使用して PDF を HTML に変換するには?
PDFをHTMLに変換するために自作を使用するように誰かが言っているだけです。すべてダウンロードできましたが、実行方法がわかりません。誰かが私にステップバイステップを教えてもらえますか?
css - HTML DIV/Pの絶対位置を任意の画面に合わせる
PDFファイルをHTMLの個別ファイルに変換しました。HTMLに正常に変換されると、テキストの位置はPDFの位置と同じになります(これは良いことです)。PDFのサイズは8.5x11ですが、HTMLに変換したときに問題が発生します。テキストが絶対位置に配置されるため、モバイルWebビューで表示するとテキストがオーバーフローします。
ここの誰かがこれに関して同様の問題を抱えている可能性がありますか?絶対位置div/pをどの画面にも合わせるにはどうすればよいですか?HTMLコンテンツをPDFファイルと同じように見せたかったのです。
前もって感謝します。
python - PDF から HTML への変換 / Python での正規表現の置換と連結の一致
PDFからExcelへのコンバーターを作成しました。変換は Linux コマンド pdftohtml によって行われますが、次のように奇妙に見えることがあります。
明らかに、次のようになります。
たとえば、最後の文字を取得し、後で連結するなど、複数のアプローチを使用しました
しかし、これはすべての文字を返すわけではありません。では、何が問題なのですか?なぜこれがすべての一致ではなく返されないのですか? さらに、と<br>
の間のすべての -Tagを置き換えようとしています</b>
<i>
しかし、それも機能しません。
これらのアプローチは正しいですか、それともより良いアプローチがありますか?
javascript - PDFを単一ページの編集可能なhtmlに変換
私はpdfファイルを単一の素敵なhtmlページに変換しようとしています.それについてサーフィンした後。私が得たソリューションは、私の要件に少し欠けています。たとえば、約 200 個の pdf ファイル用に個別の html ページを作成する必要があるためです。オンライン コンバーターは主要なソリューションではない可能性があります。そのため、要件が満たされていないため、次の解決策を試しました。
-
+
PDFをHTMLページにうまく埋め込みます。-
HTML ページは、pdf を html ページに埋め込むだけなので、編集できません。 -
+
PDF を単一の HTML ページに変換します。-
見た目はあまり良くありません。 -
+
読みやすい外観で pdf を html ページに変換します。-
HTML ページは編集できません。 -
+
PDF を見栄えの良い HTML CSS を備えた単一の HTML ページに変換します。-
多数のpdfファイルには適していない可能性のあるpdfの単一ページのサムネイルとhtmlページの画像を含む大きなフォルダーを作成します。
どこから出力を改善できますか..