私の辞書には 100 万語の単語があります。ユーザーが私の Web サイトでクエリを発行するたびに、クエリに辞書の単語が含まれているかどうかを確認し、それらに対応するカウンターを個別にインクリメントします。たとえば、ユーザーが「オバマは大統領です」と入力し、「オバマ」と「大統領」が私の辞書にある場合、「オバマ」と「大統領」のカウンターを 1 増やす必要があります。
そして時々、上位 100 語 (最も検索された語) を見たいと思っています。Hbase を使用してカウンターを格納する場合、どのスキーマを使用すればよいですか? -- 効率的なものはまだ思いつきません。
辞書の単語を行キーとして使用し、「counter」を列キーとして使用すると、counter(increment) の更新が非常に効率的になります。しかし、トップ 100 を並べ替えて返すのは非常に困難です。
誰でも良いアドバイスを与えることができますか?ありがとう。