MS Office のワード/エクセル ドキュメントを Marklogic に読み込み、xml ドキュメントと同じように xquery でクエリを実行したいと考えています。しかし、ドキュメント ファイルを Marklogic に読み込むと、バイナリ形式で読み込まれ、クエリ コンソールで表示するとジャンク文字が表示されます。次のコマンドでロードを試みました:-
xdmp:document-load("E:\doc\sample.doc",
<options xmlns="xdmp:document-load"
xmlns:http="xdmp:http">
<format>xml</format>
</options>)
しかし、ドキュメントが UTF 8 エンコードされていないというエラーが表示されます。doc ファイルと xls ファイルをそのまま Marklogic にロードできるのか、またはロードする前に xml または UTF 8 エンコード形式に変換する必要があるのかを知りたいです。はいの場合、それらを変換するプロセスは何ですか。いいえの場合、xquery を使用してクエリを実行するにはどうすればよいでしょうか。また、Office 2007 と 2010 の両方が OOXML 形式をサポートしているため、変換プロセスに MS Office 2007/2010 のインストールが必要かどうかも知りたいです。
これについて適切な指導をお願いします。