xml - XSL-FO 駆動 (Pdf) での Excel ファイルの埋め込み - ドキュメント生成

Question

現在、.xml ファイルを入力として使用し、.pdf を生成する XSL-FO 変換を使用して、すべての公式ドキュメントを生成しています。基本的に、これらの .xml 内のすべてのコンテンツは、プレーンテキストまたは xhtml のいずれかです。これは日常のユースケースでは問題なく機能しますが、XSL-Fo トランスフォーマー (Antenna House) がネイティブに処理できない Microsoft Excel ファイルを参照するユーザーもいます (そして、実際にそれを行っているユーザーは他にいません)。

そのため、中間の短期的な解決策として、ユーザーが定義した印刷領域から画像を作成し、これらの画像を .pdf に埋め込んでいます。

ただし、これらの画像は明らかに「検索可能な」コンテンツではないため、これらの .pdf などを OCR で処理する後処理ステップを検討していましたが、私の考えでは、これはすべて回避策の穴に深く入り込んでいます。

これらの .xls ファイルを SpreadsheetML に変換し、それを xsl-fo スタイルシートでカバーするというアイデアがありましたが、spreadsheetml の仕様を見て、その希望もあきらめました.. 少なくとも、実装に数十人月を投入することなく。

では、私の実際の質問に移ると、xsl-fo 駆動型のドキュメント生成で Microsoft Excel ファイルをどのように処理しますか?

乾杯と感謝、-J

score 1 · Accepted Answer

.xls ファイルに数式が含まれていますか? fo の table、row、および cell タグを使用して、xlsx を xsl-fo に変換するだけではない場合。数式を含む xlsx ファイルの xml を見たことはありません。結果だけを数式なしで「表示可能」に Excel ドキュメントを保存できるかどうか疑問に思いますか? 「エクセルに印刷」のようなものですか？

score 0 · Accepted Answer

Windward Docgenはまさにあなたが望むことを行います。Windward では、Word、Excel、または PowerPoint でドキュメントをデザインすると、当社のエンジンがそのテンプレートをデータとマージして最終的なドキュメントを作成します。このエンジンは Java と .NET で利用でき、サーバー上で Office を使用しないため、非常に高速で、Excel が埋め込まれ、すべてのマクロが評価された最終的な PDF が得られます。(免責事項 - 私は Windward の CTO です。)

score 0 · Accepted Answer

Excel ファイルを PDF に変換し、結果のドキュメントをマージできます。ただし、XSL-FO 処理による直接処理ではありません。

個人的には、Excel ファイルを PDF 内に保存しようとさえせず、PDF からリンクします。Excel は閉じられており、非常に複雑であり、開かれている部分 (新しい XML 形式) については、依然として (多くの場合) バイナリ BLOB とその移動ターゲットを含めることができます。戦う価値のある戦争だとは思わない。

xml - XSL-FO 駆動 (Pdf) での Excel ファイルの埋め込み - ドキュメント生成

3 に答える 3

Related

Reference