私の目的は、与えられた都市(用語)で動物(ドキュメント)を見つけることです
私はこの方法で文書を索引付けしました:
doc1(bear) = [city1, city2, city2, city3..]
doc2(dog) = [city1, city1, city1, city2, city2, city2, city3, city3, city3..]
..
多くの都市に出現する (動物) ドキュメント、つまり「犬」のような異なる都市/すべての都市の割合が高いドキュメントにペナルティを課したいと思います。
助言がありますか?ありがとう