問題タブ [pdf-to-html]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
pdftk - pdf から html へのコンバーターを使用して、任意のフィールドに一意の ID を設定できますか?
編集可能なPDFの画像を表示するには、ここをクリックしてください
編集可能な pdf を html に変換する必要があり、すべての編集可能なフィールドを unique_id で表示したいのですが、コンバーターで可能ですか? 以下は、変換後のpdfのhtmlです。ここで、チェックボックス要素のタグと属性はほぼ同じです。これらの要素を個別に区別する必要があります。それらを別々に読む方法はありますか?
javascript - html 形式の pdf を表示して、形式化された html を取得するにはどうすればよいですか?
ブラウザーに html 形式の pdf を表示し、その形式の html を選択、コピー、編集する必要があります。
これまでのところ、pdftohtml コマンド ライン ユーティリティと mozilla の pdf.js プラットフォームを試しました。1つのユーティリティで両方のタスクをうまく実行できないようです。たとえば、pdf.js で非常に正確な pdf を表示できますが、書式設定されたテキスト レイヤーを生成できません。テキストを選択するために作成されたオーバーレイには、配置スタイルのみがあり、フォント スタイルはありません。
この問題を解決するための最良のアプローチは何でしょうか?
php - Pdftohtml Poppler utils が centOs で動作しない
mgufrone ライブラリ ( https://github.com/mgufrone/pdf-to-html ) を使用して、php で pdf を html に変換しようとしています。これをMacで実行すると、問題なく動作します。しかし、centos サーバーで実行すると、/vendor/gufy/pdftohtml-pdf/output フォルダー内に .html ファイルが空白で作成されます。私の Mac では、ローカル倍数ファイルが /output フォルダー内に作成されます。ただし、サーバーでは、空のコンテンツで単一のファイルのみが作成されます。助けてください。