0

Solr で多くの SHA1 トークンを保存、インデックス付け、検索する必要があります。

今、私はそれらを のような 40 文字の 16 進文字列として保存します68ac906495480a3404beee4874ed853a037a7a8f。私の Solr インデックスには、約 10,000 以上の一意の SHA1 トークンがあります。

値を 20 バイトの BinaryField として圧縮して格納した方がよいでしょうか? (インデックスの半分のサイズ、より多くのパフォーマンス...?)

「Lucene in action」本で、(圧縮された) MD5 文字列の真ん中にいくつかの文字を格納するKrugleについて読んだことがあります。最大の検索パフォーマンスを得るには、これが良いでしょうか?

4

0 に答える 0