1

このような一連の単語がありますxquery(および、トランザクション、検索、ビジネス)。ここで、このシーケンスをドキュメント (pdf、doc、ppt など) とファイルで検索したいと考えていxmlます。ドキュメントのいずれかで単語のいずれかが一致する場合、URIそのドキュメントの が返されます。Marklogicでこれを行う最も効率的な方法は何xqueryですか?

4

1 に答える 1

0

最初の問題は、ユーザーが指定した文字列から単語をトークン化することです。http://docs.marklogic.com/5.0doc/docapp.xqy#display.xqy?fname=http://pubs/5.0doc/apidoc/SearchBuiltins.xml&category=SearchBuiltins&function=ctsを使用してこれを行う簡単な方法を次に示します。cts:tokenize トークナイズ

cts:tokenize('now is the time')[. instance of cts:word]

単語を取得したら、cts:word-queryコンストラクターおよびcts:searchでそれらを使用するか、高レベルの検索 API を拡張してこれを処理することができsearch:resolve ます。 xqy?fname=http://pubs/5.0doc/apidoc/searchapi.xml&category=検索&関数=検索:解決

当然のことながら、バイナリ コンテンツ (pdf、doc、ppt) は最初にドキュメントの変換が必要です。 /search-dev-guide/binary-document-metadata.xml

于 2012-09-06T18:30:06.950 に答える