問題タブ [docx4j]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
3049 参照

java - docx4jでaddParagraphOfTextにスペースを設定するには?

MainDocumentPart に追加した後、段落のプロパティを変更する方法はありますか?

最後の行では、setSpace("preserve") を使用して空白を保持したいのですが、どうすればよいですか?

ありがとう、ロンサック

0 投票する
1 に答える
1167 参照

android - docx4jを使用してpptxをhtmlビューに変換します

docx4j.jarを使用してpptxをhtmlビューに変換するのを手伝ってくれる人はいますか? このフォーラムですでに尋ねられた多くの関連する質問を調べましたが、何も役に立ちませんでした。簡単な変換プロセスを教えてください (関連するクラスと呼び出すメソッドに名前を付けるだけです)。まあ、私はこれをすべて「Android」アプリで行っており、サードパーティのソフトウェアは必要ありません(アプリ内でのみ pptx を開く必要があります)。

0 投票する
1 に答える
3335 参照

java - POI または docx4j は、パスワードで保護された Word ドキュメントを読み取ることができますか?

POI に問題があり、助けてもらいたいです。

私は個人的な日記を持っており、年ごとのフォルダーに保存されている Word .doc に月ごとに毎日のエントリを作成して、何年も保管してきました。それぞれを開くためのパスワードを追加しているので、すべて暗号化されています。

Lucene を使用してコレクション全体のインデックスを作成し、より適切に検索できるようにしたいと考えています (たとえば、「オートミールがどれだけ好きかについて最後に書いたのは何年何月何日ですか?」など)。

最初のステップは、POI を使用して Word .doc を読み取ることでしたが、暗号化されたファイルを読み取ることができないため、10 セント硬貨から降りることができません。

私はこのクラスを書きました:

私はそれを試すためのJUnitテストを持っています:

JUnit テストを実行すると、次のスタック トレースが得られます。

POI ドキュメントと javadocs は役に立ちませんでした。docx4j への切り替えを考えたところで、私は十分に不満を感じています。これは、すべての .doc ファイルを .docx に変換することを意味します (もちろん、適切なバックアップの後)。

docx4j を使用して暗号化され、パスワードで保護されたファイルを読み取ることに成功した人がいるかどうか知りたいです。誰?押す価値があることを伝えるために、肯定的な答えが欲しいだけです。

私がPOIで間違っていることを誰かが理解できるなら、私もそれを知ってうれしいです. ありがとう。

0 投票する
2 に答える
9003 参照

java - docx -> pdfをdocx4jで変換するときにフォントエンコーディングを変更するにはどうすればよいですか?

docx ドキュメントを pdf に変換すると、国別文字が「#」マークに変換されます。
PDFドキュメントのフォントエンコーディングを設定する方法はありますか?

私は過去に xdocreport を使用しており、それを処理できますが、画像、ヘッダー、およびフッターに問題がありました。

Docx4j はこれを行うことができますが、フォントはできません。変換後、Windows-1250 を使用したいのですが、フォントは ANSI エンコーディングになります。これを設定するオプションはありますか?

0 投票する
1 に答える
3550 参照

docx4j - docx4jを使用してWord文書からコンテンツを解析する

以前の回答のおかげで、パスワードで保護されたWord2010ドキュメントを読むことができるようになりました。(.docから.docxに1つずつ翻訳する必要があります。1994年にさかのぼりますが、問題ありません。)

はじめに簡単なJavaクラスを作成しました。

そしてそれを駆動するためのJUnitテスト:

テストにブレークポイントを設定して、ドキュメントを読み取った後のdocx4jの動作を確認しました。8つのパーツのリストが表示されますが、内容が見つからずにツリーをウォークスルーしました。

各ドキュメントは日付と内容のページで構成されていますが、ページが見つかりません。彼らはどこに住んでいますか?

0 投票する
1 に答える
2704 参照

java - docx4j : 「利用可能な適切な JAXB 実装がありません」ランタイム エラー Java 1.5

docx4j を使用して docx ファイルを解析しています。docx4j サイトdocx4j downloadsからすべての JAR をダウンロードしました。

コードで使用すると、コードの最初の行で実行時エラーが発生します: -

例外は次のとおりです。

0 投票する
1 に答える
1316 参照

docx4j - docx4j がサポートする XHTML タグのリスト

docx4j XHTML インポーターでサポートされている XHTML タグと CSS 属性を示すリストはありますか?
ありがとう。

0 投票する
3 に答える
6792 参照

java - jarの実行中にInvocationTargetExceptionを防ぐ方法は?

私は(少なくとも私にとっては)奇妙なケースに遭遇しました。プロジェクトを Eclipse から実行しているときは、すべて問題ありません。しかし、プロジェクトを jar ファイルにエクスポートすると、InvocationTargetExceptionで失敗します。私は他の外部ライブラリを使用していますが、すべて正常に動作し (プログラムの実行時間は約 5 分です)、最後に docx が作成されます。

私はcmdで実行していますが、次のように出力されます:

スレッド「メイン」での例外 java.lang.reflect.InvocationTargetException

原因: java.lang.ExceptionInInitializerError

com.lesswire.wita.Wita.CreateReport (Wita.java:1320) で

どうすれば私のjarファイルで動作させることができますか?

ありがとう、ロンサック

0 投票する
2 に答える
3814 参照

out-of-memory - Docx4jとPdfBoxを使用してDocxを画像に変換すると、OutOfMemoryErrorが発生します

dox4jとpdfboxを使用して2つのステップでdocxファイルの最初のページを画像に変換していますが、現在はOutOfMemoryError毎回取得しています。

convertToImageメソッドが呼び出されている間、このプロセスの最後のステップで例外がスローされることを確認できましたが、このメソッドの2番目のステップを使用して、しばらくの間問題なくpdfを変換してきました。おそらくdox4jがpdfをエンコードしていない限り、何が原因であるかについて私は途方に暮れています。これは、私がまだテストしていないか、破損している方法です。

ByteArrayOutputStreamをaに置き換えてみましたがFileOutputStream、PDFが正しくレンダリングされるようですが、予想よりも大きくはありません。

これは私が使用しているコードです:

編集 この状況についてより多くのコンテキストを提供するために、このコードはgrailsWebアプリケーションで実行されています。FileInputStreamとFileOutputStreamを使用して、より多くの物理メモリを節約し、docx4jとpdfboxの出力を検査するなど、このコードのいくつかの異なるバリアントを試しました。それぞれが正しく機能しているようです。

docx4j2.8.1とpdfbox0.7.3を使用しています。pdf-rendererも試しましたが、それでもOutOfMemoryErrorが発生します。私の疑いは、docx4jがメモリを使いすぎているが、PDFから画像への変換までエラーを生成しないということです。

答えとして、docxファイルをpdfまたは直接画像に変換する別の方法を除いて喜んでいますが、現在、サーバーでの実行に問題があったjodconverterを置き換えようとしています。

0 投票する
1 に答える
3825 参照

java - Docx4jはプログラムでw:sdtコンテンツコントロールを追加します

プロジェクトの要件を満たすためにdocx4jでカバーする必要のあるすべての「ドキュメント関連」機能をテストするための小さなJavaプログラムを構築しています。要約すると、ユーザーに「生のテンプレート」として提供される「コンテンツコントロール」を使用してテンプレートを作成できること。ユーザーがそれらを拡張して、最終的にデータを入力できるようにします。「繰り返して条件付き」の機能があるため、「docx4j」を扱っています。

これは、プログラムによる私の進歩です。

1)空白のドキュメントを作成します(DONE)

2)xmlデータ(請求書の例ではpart3.xml)を使用してカスタムxmlパーツを追加します。(終わり)

3)xml xpaths参照(請求書の例ではpart4.xml)を使用してカスタムxmlパーツを追加します。(終わり)

4)コンテンツコントロールを追加します(保留中)

請求書の例からのこの抜粋に似たものである必要があります。

そしてここに私の質問があります:このxmlを生成する方法は?Javaコードで実行できますか、それともWordからのみ実行できますか?「1418037941」と「DefaultPlaceholder_22675703」の値はどのように生成されますか?私はそれらを「発明」することはできず、どこか他の場所で参照されていると思います。MainDocumentPartクラスでそのためのメソッドを探していましたが、見つかりませんでした。私は何かを誤解していますか?

他の手順は私にとってほとんど問題ありません:

5)「前処理」を実行します(完了)

6)「プロセス」を実行します(完了)

7)「ストリップ」を実行します(repatタグを削除することを除いて完了)

ご助力ありがとうございます!デビッド