このような一連の単語がありますxquery
(および、トランザクション、検索、ビジネス)。ここで、このシーケンスをドキュメント (pdf、doc、ppt など) とファイルで検索したいと考えていxml
ます。ドキュメントのいずれかで単語のいずれかが一致する場合、URI
そのドキュメントの が返されます。Marklogic
でこれを行う最も効率的な方法は何xquery
ですか?
質問する
185 次
1 に答える
0
最初の問題は、ユーザーが指定した文字列から単語をトークン化することです。http://docs.marklogic.com/5.0doc/docapp.xqy#display.xqy?fname=http://pubs/5.0doc/apidoc/SearchBuiltins.xml&category=SearchBuiltins&function=ctsを使用してこれを行う簡単な方法を次に示します。cts:tokenize
トークナイズ
cts:tokenize('now is the time')[. instance of cts:word]
単語を取得したら、cts:word-query
コンストラクターおよびcts:search
でそれらを使用するか、高レベルの検索 API を拡張してこれを処理することができsearch:resolve
ます。 xqy?fname=http://pubs/5.0doc/apidoc/searchapi.xml&category=検索&関数=検索:解決
当然のことながら、バイナリ コンテンツ (pdf、doc、ppt) は最初にドキュメントの変換が必要です。 /search-dev-guide/binary-document-metadata.xml
于 2012-09-06T18:30:06.950 に答える