2

EC2構成

mlarge machine - 
4 CPU,
7.5G,
EBS volume,
JVM Memory - 6G,
Solr Version tested on both 4.0-ALPHA and 3.6.1

schema.xml

<fieldType name="tdouble" class="solr.TrieDoubleField" precisionStep="4" positionIncrementGap="0"/>
<field name="id" type="long" indexed="true" stored="true" required="true" />
<field name="location" type="location" indexed="true" stored="true"/>
<field name="location_0_coordinate" type="tdouble" indexed="true" stored="true" />
<field name="location_1_coordinate" type="tdouble" indexed="true" stored="true" />
<field name="text" type="text_general" indexed="true" stored="false" multiValued="true"/>

solrconfig.xmlに変更はありません。

編集:

<query>
  <filterCache class="solr.FastLRUCache" size="512" initialSize="512" autowarmCount="0"/>
  <queryResultCache class="solr.LRUCache" size="512" initialSize="512" autowarmCount="0"/>
  <documentCache class="solr.LRUCache" size="512" initialSize="512" autowarmCount="0"/>
  <enableLazyFieldLoading>true</enableLazyFieldLoading>
  <queryResultWindowSize>20</queryResultWindowSize>
  <queryResultMaxDocsCached>200</queryResultMaxDocsCached>
  <useColdSearcher>false</useColdSearcher>
  <maxWarmingSearchers>2</maxWarmingSearchers>
</query>

ロードされたデータの1億2800万レコード。

Javaクライアントコード

        ModifiableSolrParams params = new ModifiableSolrParams();
        params.set("wt","csv");
        params.set("df","id");
        params.set("fl", "id,location");
        params.set("q", "*:*");
        params.set("fq", "{!geofilt}");
        params.set("sfield", "location");
        params.set("d", "0.05");
        params.set("pt",  columns[1] +"," + columns[2]);
        QueryResponse response = solr.query(params);

Tasks:  71 total,   1 running,  70 sleeping,   0 stopped,   0 zombie
Cpu(s): 38.7%us,  0.0%sy,  0.0%ni, 49.4%id,  0.0%wa,  0.0%hi,  0.0%si, 11.9%st
Mem:   7634740k total,  7570960k used,    63780k free,   150708k buffers
Swap:        0k total,        0k used,        0k free,  3914812k cached

PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND                                                                                                                                         
956 root      20   0 25.7g 4.0g 889m S 100.1 55.2 353:48.70 java

つまり、結果として、ドキュメントのクエリには平均で約1.5秒かかります。

record 203 response Time 1108 result: 42.7461000,-73.6924000, 
record 207 response Time 1123 result: 40.8448850,-73.7156030, 
record 210 response Time 1180 result: 40.8087660,-74.1583510, 
record 211 response Time 1656 result: 0, 
record 212 response Time 1423 result: 0, 
record 213 response Time 1316 result: 39.1027710,-76.7964910.

助言がありますか?

4

2 に答える 2

2

Solr3.x用のドロップイン地理空間プラグインであるSOLR-2155をお試しください

基盤となるアルゴリズム/アプローチは、Lucene / Solr 4の新しい空間モジュールの心臓部です。SOLR-2155はLatLonTypeよりも優れているため、SOLR-2155を使用していると言われています。

SOLR-2155を試して、同じ状況での速度を教えてから、インデックスを2〜3個のシャードに分割し、分散検索を実行することをお勧めします。

于 2012-07-24T23:30:46.230 に答える
0

はい、初心者向けです。solrconfig.xmlの変更がない場合。つまり、\ exampleにあるものを変更せずに使用しているということです。おそらく必要のないものがたくさんあるので(例として、さまざまな機能を示しています)、そこから不要なものを削除します。 (主に私が思うフィールド)そしてもう一度テストします。

于 2012-07-24T20:42:54.790 に答える