1

私は学生で、ビッグデータの検索エンジンを探しています。MarkLogic サーバーは見つかりましたが、サポートされているファイルの種類がわかりません。doc、docx、pdf、xml、ppt、pptx などをサポートしていますか? 他にどのようなタイプがサポートされていますか?

4

1 に答える 1

3

低レベルでは、MarkLogic は xml、プレーンテキスト、およびバイナリのストレージをサポートしています。XML は、ファセット検索用の範囲インデックスを含め、完全に検索可能です。テキストは全文検索のみ可能です。バイナリはそのままでは検索できませんが、多くのバイナリ形式からメタ情報やテキストを抽出する機能があります。後者の詳細については、オンライン ドキュメントを参照してください。

http://docs.marklogic.com/guide/search-dev/binary-document-metadata#chapter

この機能を示すサンプル アプリケーションがあります。

http://developer.marklogic.com/code/document-discovery

チッ!

于 2013-07-15T08:16:42.993 に答える