BaseX に巨大な XML ファイルが保存されています。以下は、XML ノードの構造です。
Datas (Parent Node)
- Data (Child of above)
- Desc (Child of above)
- P (Child of above) and contains the actual text
P
タグにはすべてのテキストが含まれており、P
タグ内にある特定の単語の出現回数をカウントする必要があります。
フルテキスト インデックスを作成しました。特定の単語の出現をカウントするために、次の2つのクエリを使用しています
ft:count(doc('BHCR')/Datas/Data/Desc[. contains text 'revolution'])
このクエリは 2177 を返し、25 秒かかりました。
もう一つ
ft:count(doc('BHCR')/Datas/Data/Desc[text() contains text 'revolution'])
このクエリは 3684 を返し、52 ミリ秒かかりました。
どちらが正しいですか?これら2つのクエリの違いを説明できる人はいますか?