問題タブ [document-conversion]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
html - A.nnotate.com の背後で使用されているテクノロジーは何ですか?
A.nnotate.com、Scribd、Google Docs などのサービスが PDF、.doc、またはその他のドキュメントを HTML にレンダリングする方法と、注釈システムがどのように機能するかを知りたいです。
solr - Solr で PDF を解析するための Tika/PDFBox の代替 (1.4 以降の任意のバージョン)
Solr が PDF ファイルを正しく解析していないようです。PDFファイルを解析するためにApache Tika(PDFBoxを内部で使用していると思われる)を使用する代わりに他の方法があるかどうか疑問に思っていましたか?これを使用すると、コンテンツ間にランダムなスペースができるようです。同じ問題を抱えているPDFBox(最新バージョン)を介してPDFを直接実行することで、問題を特定しました。
Omnifind などの一部の OCR 商用ソフトウェアは PDF で問題なく動作しますが、それらを同じ方法で Solr と統合することはできず、購入することもできません。
java - PDF ファイルを単一の HTML ファイルに変換する
JavaでPDFドキュメントを単一のHTMLファイルに変換しようとしています。オンラインのほとんどのコンバーターは、1 つの PDF ファイルを複数の HTML ファイルに変換します。PDF全体を単一のHTMLファイルに変換したい。
助言がありますか?
php - PPTまたはODTをPDFに変換するための無料のPHPライブラリはありますか
コマンドライン アクセスもできない共有ホスティング アカウント (Linux) でドキュメント マネージャーを使用しています。
人々がプレゼンテーションをアップロードするとき、人々がダウンロードできるようにそれらを PDF に変換する必要があります。ヘッドレス オープン オフィスをインストールすることでこれを行う方法があると読みましたが、このサーバーでは実行できません。
ドキュメント変換を管理できる無料の PHP ライブラリはありますか?
乾杯!
pdf - Tools to convert multipage PDF to multipage TIFF
I'm writing a small application to convert several multipage PDF's to multipage TIFF files. Per the other questions and answers on this site, I've tried both ghostscript and ImageMagick however both pieces of software only covert the first page when I run them. Are there any other tools I can use to accomplish this, preferably open source ones?
html - モバイル アプリ用のオープン ソース html5 ドキュメント ビューア
Phonegap を使用して、Android および iOS プラットフォーム用のモバイル アプリを構築しています。html5 ドキュメント ビューアーを使用して、 pdf、ppt、およびすべてをモバイル アプリに表示したいと考えています。
クロコドックを見ました。それは良いことですが、いじることができるオープンソースが必要です。
現在、モバイル アプリでドキュメントを表示するためのオープン ソース ソリューションがあるかどうかを教えてください。
pdf - TIFFをインデックス可能なPDFにバッチ変換するコマンドラインソフトウェア
TIFFファイルをインデックス可能なPDFにバッチ変換するユーティリティが必要です。ソフトウェアはLinuxで実行する必要があり、コマンドラインから動作する必要があります。ソフトウェアはオープンソースである必要はありません。tesseractとhocr2pdfを使用して変換を試しましたが、テキストが文字化けしたPDFが生成されます(注:PDF内の「すべての」テキストを「すべて選択」した場合にのみテキストが文字化けします)。他のユーティリティを見つけましたが、それらはWindowsでのみ実行されるか、コマンドラインからは機能しません。前もって感謝します。
ms-word - JavaでMicrosoft WordをPDFに変換するための最良のアプローチ(JODConverter+open OfficeまたはApache POI HWPF+iText)はどれですか?
私のアプリケーションでは、顧客のステータスが変更されたときに顧客に自動メールを送信する必要があります。PDF 形式のドキュメントをそのメールに添付する必要があります。この添付の PDF ドキュメントを既存の Word ドキュメントから作成する必要があります。Apache Open Officeはインストーラーであり、ドキュメントを変換するたびにサービスとして開始する必要があります。 HWPF + iText .どちらを使用するか提案してください。
c# - Visual Basic から C-sharp への日付の変換
そのため、ユーティリティの練習として、私たちの貧弱な古い vb .net 1.1 アプリの 1 つを C# .net 4.0 に変換することにしました。
開始点としてテレリック コード変換を使用したところ、最終的に 150 個までのエラーが発生しました (20k 以上のコードを考慮すると、それほど悪くはなく、本番ソースを使用してエラーなしで実行できることはめったにありません)。その多くは時間/日付を処理します。 vb と c# で。
私の質問は、VB で次のステートメントをどのように表現しますか?
C#で?コンバーターがくれた
もちろんこれは正しくありませんが、正しくする方法がわかりません。
node.js - node.jsで文書をプレゼンテーションに変換するサービスの作り方
ドキュメントを ppt プレゼンテーションに変換する node.js サーバーを作成したいと考えています。この仕事には Open Office を使用すると思いますが、開始方法がわかりません。また、誰かが私を良い方向に向けるのを手伝ってくれるかどうか、おそらく他のプログラミング言語で Open Office を使用する方法についてのチュートリアルを教えてください。