0

クエリ (日付範囲クエリ) から「上位 10 語」を知りたいです。日付ごとの「総用語頻度」が必要です...ドキュメントの数ではなく、インデックス全体の用語頻度の数だけではありませSolr TermsComponent と Lucene の HighFreqTerms を調べましたが、どちらもクエリの結果として必要な操作をサポートしていないようです。

私のインデックスは非常に単純です...すべてのアイテムは、(クエリをサポートするための)「dateCreated」フィールドを持つ「content」フィールドに入ります。私が使用できるテクニックについて何か考えはありますか?

4

2 に答える 2

0

ファセットは、探しているもののほとんどを提供しますが、用語の合計頻度ではなく、各用語のドキュメントの頻度を示します。日付範囲クエリを呼び出しとして作成し、パラメーターを 追加し/selectます 。rows=0facet=truefacet.field=<the field with the required terms>facet.limit=10

というフィールドtextでは、応答の一部は次のようになります。

<lst name="facet_counts">
  <lst name="facet_queries"/>
  <lst name="facet_fields">
    <lst name="text">
      <int name="from">3690</int>
      <int name="have">3595</int>
      <int name="it">3495</int>
      <int name="has">3450</int>
      <int name="one">3375</int>
      <int name="who">3221</int>
      <int name="he">3137</int>
      <int name="up">3125</int>
      <int name="all">3112</int>
      <int name="year">3089</int>
    </lst>
  </lst>
  <lst name="facet_dates"/>
  <lst name="facet_ranges"/>
</lst>

警告、このリクエストは遅いかもしれません!

于 2013-10-10T02:22:01.923 に答える