1

Notes RichText フィールドに OLE オブジェクトとして埋め込まれた大量の PDF ドキュメントを含むデータベースがあります。これらは XPages と互換性がないため、OLE オブジェクトをファイル (添付ファイル) に変換する必要があります。どうすれば自動的にそれを行うことができますか (Notes クライアントで実行する必要があることはわかっています (必要ですか?) - または、それらを抽出する POI の方法はありますか?

明確化
blob を (必要に応じてメモリに) 抽出できますが、blob は OLE コンテナーであるため、ディスクに書き出すと PDF ファイルは作成されません。したがって、2つの可能なパスが表示されます:

  • OLE オブジェクトをアクティブ化し、そこでメソッドを使用する
  • blob を読み、PDF 部分を抽出するものを用意します (おそらくApache POI )

しかし、私はこれらのアプローチのいずれにも触れておらず、何時間ものテストを節約できるアドバイスがあるかどうか疑問に思っていました

4

2 に答える 2

1

dxlツールで可能でしょうか?私はdxlエクスポーターと協力してドキュメントから埋め込み画像を抽出しましたが、これはoleオブジェクトでも実行できますか?

openntfのロータススクリプトゴールドコレクションプロジェクトのEmbeddedImageオブジェクトのわずかに変更されたバージョンを使用しました

このライブラリには、DXLで画像タグを検索してその内容を解析しようとするオブジェクトEmbeddedimagelistが含まれています。たぶん、これは埋め込まれたoleオブジェクトにも当てはまります。

于 2012-10-23T09:08:25.750 に答える
0

%PDF を検索してからすべてを保存するようなものだと思います。ファイルとして PDF を作成する必要があるからです。理論的には、OLE ファイルにはさまざまなものが含まれる可能性がありますが、ほとんどの場合、単に OLE ヘッダー (またはそれが呼ばれるもの) がプレフィックスとして付けられたファイルが得られます。

私はこのアプローチを1回使用しましたが(PDFではありません)、うまく機能しているように見えました。

jjtbsomhorstが話しているのは、openntfのアプローチに基づいていると思います:-)

于 2013-12-24T06:50:47.947 に答える