問題タブ [docx4j]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - docxドキュメントを処理するためのApachePOIまたはdocx4j
docxドキュメントをJavaオブジェクトとして読み取るためにどちらを使用するのが良いと思いますか。その理由は何ですか。
言い換えると。どのライブラリがほとんどの単語タグをサポートしていますか?
java - DOCX4J:ヌルポインター例外
WordprocessingMLPackage.createPackage()メソッドを使用して新しいドキュメントファイルを作成しました。現在、デフォルトのスタイル(「見出し1」、「通常」など)の内容を操作しようとしています。スタイルのプロパティの値を出力しようとすると、NullPointerExceptionが返されます。名前を印刷できるので、スタイルはそこにあると確信しています。しかし、段落のプロパティにアクセスしようとすると、nullになります。
だから今、私はコンテンツに正しくアクセスしていないのだろうかと思っています。
java - DOCX4J: HTML でエクスポートされたドキュメント ファイルを JEditorPane で表示する
DOCX4J によって生成された xHTML ファイルを表示しようとしていました。上記のファイルを正常に生成できました。テキストのすべての書式設定がブラウザーに正しく表示されます。ただし、JEditorPane で表示しようとしていたところ、HTML ファイル内のテキストのみが表示され、ページ全体がデフォルトのテキスト フォントを使用しているかのようにフォーマットは表示されませんでした。これが JInternalFrame の私のコードです
URL を有効な Web アドレスに変更してみましたが、ページは正しく表示されます。JFrameで同じ手順を実行しようとしましたが、同じ結果が発生しました。手順が間違っているのか、それとも DOCX4J ライブラリによって生成された HTML ファイルに問題があるのか 疑問に思っていました。
HTML http://www.mediafire.com/?z3t8ksv3c2air27が必要な場合に備えて、HTML ファイルと DOCX ファイルを含めました 。
java - 2G の Docx4j Permgen Space と、PDF に変換するときの小さなドキュメント
5kb の .docx ファイルが Docx4j-2.8.1 に読み込まれ、PDF に変換されます。単体テストではこれは機能しますが、Tomcat 7 (実際には TomEE-1.6.0-SNAPSHOT) にデプロイされると、PDF 変換を実行するときに Permgen space エラーが発生します。
サンプルコード:
inputStream は、.docx ファイルの byte[] から作成されました。docx ファイル自体は、Times New Roman のテキストといくつかの箇条書き (サンプル用) のみの単一ページです。
スタック トレースは次のとおりです (上部のログにヒープ サイズを追加しました)。
https://gist.github.com/jmkgreen/5046890
このマシンには 6GB の RAM があり、Tomcat には次のセットがあります。
このエラーが表示されるとは思っていませんでした。アドバイスをいただければ幸いです。
編集: PDF コンバーターを呼び出す直前に、Perm Gen の MemoryPoolMXBean から getUsage().getMax() を追加しました: 82MB。
また、JAVA_OPTS の tomcat catalina.bat ファイルのエントリを次のように減らしました。
編集 2: docx4j から XDocReport に切り替えると、クラッシュが解決します。残念ながら、特に正確なレンダリングも提供しません...
java - docx4j でテンプレートから新しい単語を作成する方法
次のシナリオがあり、アドバイスが必要です。
ユーザーは単語文書をテンプレートとして入力し、実行時にいくつかのパラメーターを提供して、データベースにクエリを実行し、文書を埋めるためのデータを取得できるようにします。だから、私がする必要がある2つの基本的なことがあります:
- ドキュメント内のすべてのキーを、現在のクエリ行からのそれぞれの結果に置き換えます。
- クエリから取得した行数に応じて、既存のドキュメントを変更せずにそれ自体に「マージ」(コピー? 複製?) し、この新しいコピーのキーを次の行の値に置き換えます。
これを行うための最良のアプローチは何ですか?ハッシュマップを提供する unmarshallfromtemplate を使用して、今のところ置換部分を行うことができました。しかし、ドキュメントに「${variable_name}」を追加する必要があり、単語が異なるタグで「${」と「}」を区切って問題を引き起こすことがあるため、この方法は少し注意が必要です。
カスタム xml バインディングについて読んだことがありますが、完全には理解できませんでした。カスタム XML を生成し、それをドキュメントに挿入して (この un ランタイムのすべて)、applybindings を呼び出す必要がありますか?? これが当てはまる場合、ドキュメント内のフィールドを xml にバインドするにはどうすればよいですか? 名前で?
java - DOCX4J - 2 つのマーカー間のコピー
このすばらしいガイドのおかげで、DOCX4J に簡単に置き換えることができました。
しかし今、私はもっと複雑なことをしようとしています。
私がやりたいのは、ドキュメント内でマーカー テキスト #1 を見つけ、ドキュメント内でマーカー テキスト #2 を見つけて、2 つの間のすべてをコピーすることです。次に、そのコンテンツを X 回貼り付けて、さらに変更を加えます。
誰かが私がこれを行う方法を知っていて、おそらく必要な主要な機能を教えてくれますか?
java - Docx を HTML に変換するための Docx4J のカスタム ソリューション
DOCX
複数のファイルをフォーマットに変換するというこの要件がHTML
あり、可能であれば、RTF
Docx4j
これを行うための優れた Java ライブラリのようです。
HtmlExporterNG2.html メソッドを使用しても、必ずしも望ましい結果が得られるとは限りません。したがって、docx ファイルから抽出されたスタイルシートを変更し、それをこの変換に使用することを考えています。これらの docx ファイルはすべてフォーマットが異なり、標準のスタイルシートを使用できないからです。
スタイルシートの実行時のいじくり回しが機能すると考えるのは正しいですか? そして、私が知っておくべき重要なことは何ですか?
Java バージョン 6 のスタンドアロン Java アプリケーションとして使用しています。
私のクエリは少しあいまいかもしれませんが、この時点で正しい方向性を探しています。
docx4j - docXに楕円(円)を挿入するには?
成功せずにdocxに楕円を挿入しようとしています。docx4jでdocxに楕円を追加することは可能ですか? また、org.docx4j.XmlUtils.unmarshalString を使用して XML "....." を挿入しようとしましたが、いくつかのエラーが発生しました。
誰かやろうとした?
jaxb - JBoss AS 7.1 で使用されていた JAXB を JDK 6 の JAXB に変更する方法
Jboss AS 7.1 にデプロイされた Spring Web アプリがあり、JDK 1.6 を使用しています。また、docx4j を使用して、ms office の word ファイルを処理します。
Jboss は独自の jaxb 実装を強制します。ただし、docx4j には JDK 1.6 の jaxb 実装が必要でした。
jboss の jaxb の代わりに jdk の jaxb を使用するにはどうすればよいですか?
java - プログラムでJavaでdoc、docxファイルをpdfに変換する方法
docx4j を使用して docx ファイルから pdf を生成できますが、画像と表を含む doc ファイルを pdf に変換する必要があります。 Java で doc を docx に変換する方法はありますか。または(ドキュメントからPDFへ)?