プログラミングの質問のように書き直されました
さて、もう少し調査を行ったところ、使用する必要がある Java パッケージは docx4j のようです。残念ながら、私はパッケージと PDF 形式の基盤に精通していないため、返されたヘッダーとフッターを正確に使用する方法を理解することが困難ですSectionWrapper.getHeaderFooterPolicy()
。HeaderPart
返されたおよびFooterPart
オブジェクトが書き込み可能かどうか、またはそれらを変更する方法は完全には明らかではありません。
ヘッダー部分を作成する方法の例を提供するこのコードがありますが、新しいものを作成してドキュメントに追加します。HeaderPart
既存のヘッダー/フッター部分を見つけて、可能であれば削除するか、それらを空にしたいと考えています。理想的には、それらはドキュメントから完全に削除されます。
このコードは似ており、使用してヘッダー部分のテキストを設定できますが、この用語の多くはなじみがなく、最終結果として、各ドキュメントでヘッダーを削除するのではなく (空のものではありますが)作成するsetJaxbElement
ことになるのではないかと心配しています。
以下の元の質問
さまざまな MS Word ドキュメントのセットを扱っています。それらを単一の PDF にコンパイルしていますが、そうする前にヘッダーやフッターがないことを確認したいと考えています。
理想的には、Times New Roman でない場合は、デフォルトのフォントもオーバーライドしたいと思います。
これをプログラムで行う方法や、ある種のバッチ処理を使用する方法はありますか?
現在OfficeまたはWordがインストールされていないWindowsサーバーでこれを実行します(ただし、OpenOfficeがインストールされている可能性があり、もちろんインストールを追加するのも簡単です).
現在、iText(Java)のいくつかのバージョンを使用してファイルをPDFに変換しています。どうやら iText はヘッダー/フッターの削除などを行うことができないことはわかっていますが、最新の .doc ファイルの基礎となる構造は XML であるため、API (または XML 解析/編集 API) があるかどうか疑問に思っています。ヘッダーとフッターを削除し、いくつかのデフォルト スタイルを設定するための RegEx [恐怖])。