現在、Java で Oracle OutsideIn 検索およびエクスポート ツールを実装して、さまざまなファイルのメタデータとコンテンツを抽出しています。フォルダー内の複数のファイルでこれを実行できましたが、別のファイルに埋め込まれたファイルを抽出できませんでした。これが検索とエクスポートで可能かどうかを知りたいです。
そうでない場合は、CleanContent を使用しますが、Microsoft ファイルと PDF ファイルしか受け入れられません。
検索エクスポートは、アーカイブ内または他の種類のファイル内の埋め込みファイルを変換または抽出できます。埋め込みには 3 つの異なるタイプがあり、それぞれに変換を制御する独自のオプションがあります。3 つのタイプは、アーカイブ サブドキュメント、電子メールの添付ファイル、および一般的な埋め込みです。デフォルトでは、最初の 2 つは変換されますが、3 番目は変換されません。一般的な埋め込みの変換を有効にするには、SCCOPT_XML_SEARCHML_FLAGS オプションで SCCEX_XML_EMBEDDINGS フラグを設定します。SDK で提供されているエクスポーター サンプル アプリを使用している場合は、CFG ファイルで次を有効にしてみてください。
埋め込みフラグはい
埋め込みのバイナリ コピーを抽出しようとしている場合は、3 段階のプロセスになります。最初の変換で、SCCOPT_XML_SEARCHML_FLAGS オプションで SCCEX_XML_PRODUCEOBJECTINFO フラグを設定します。その情報を使用して、DAOpenDocument に渡される SCCDAOBJECT 構造を埋めます。その関数から返される hDoc を DASaveInputObject に渡して、埋め込みのバイナリ コピーを保存できます。これは、上記の 3 種類の埋め込みのいずれでも機能します。このプロセスを示す Java サンプル アプリはありません。