0

私はElasticsearchを初めて使用し、これを解決するために数時間を費やしました。助けていただければ幸いです。

:) (そうでもない)

スペインの都市と州を含む 8000 を超えるドキュメントを含む CouchDB データベース (spain_locales) を作成しました。一方、jQuery オートコンプリートを備えた HTML フォームがあり、入力すると結果が表示されます。作成した PHP (Laravel Service Provider) から ElasticSearch に接続し、jQuery Autocomplete の結果を返します。これは、クライアントから ElasticSearch に直接接続することで実現できると思いますが、セキュリティ上の理由から、今のところこの方法を好みます。

:( 問題:

ElasticSearch から得られる結果は、私が期待していたものとまったく同じではなく、自分が持っているものを修正する方法や、それが正しい方法であるかどうかもわかりません。ブールクエリが必要なものなのか、それとも他のタイプのクエリを使用する必要があるのか​​ わかりません。

  1. データベースとまったく同じように単語を入力した場合にのみ、結果が得られます。

    Álavaと入力すると結果が得られますが、Alavaでは得られません( Áアクセントが違いを生みます)

  2. 完全な単語を入力するまで結果は得られません。

    Albacete と入力すると結果が得られますが、Albacete については得られませ

CouchDB River Plugin for ElasticSearch を使用して、CouchDB と ElasticSearch を同期させました >> https://github.com/elasticsearch/elasticsearch-river-couchdbと、次のコマンド トラフ ターミナルで作成しました。

curl -XPUT 'localhost:9200/_river/spain_locales/_meta' -d '{
    "type" : "couchdb",
    "couchdb" : {
        "host" : "localhost",
        "port" : 5984,
        "db" : "spain_locales",
        "filter" : null
    },
    "index" : {
        "index" : "spain_locales",
        "type" : "spain_locales",
        "bulk_size" : "100",
        "bulk_timeout" : "10ms"
    }
}'

私も試しました:

curl -XPUT 'localhost:9200/_river/spain_locales/_meta' -d '{
    "type" : "couchdb",
    "couchdb" : {
        "host" : "localhost",
        "port" : 5984,
        "db" : "spain_locales",
        "filter" : null
    },
    "index" : {
        "number_of_shards" : 2,
        "refresh_interval" : "1s",
        "analysis": {
          "analyzer": {
            "folding": {
              "tokenizer": "standard",
              "filter":  [ "lowercase", "asciifolding" ]
            }
          }
        },
        "index" : "spain_locales",
        "type" : "spain_locales",
        "bulk_size" : "100",
        "bulk_timeout" : "10ms"
    }
}'

上記のいずれもエラーを返さず、_river 同期を正常に作成しますが、まだアクセントと単語全体の問題があります。

また、ターミナルから次のコマンドを使用して、必要なフィルターを何らかの方法で適用しようとしました。

curl -XPUT 'localhost:9200/spain_locales/' -d '
{
  "settings": {
    "analysis": {
      "analyzer": {
        "folding": {
          "tokenizer": "standard",
          "filter":  [ "lowercase", "asciifolding" ]
        }
      }
    }
  },
  "uuid":"KwKrBc3uQoG5Ld1nOdc5rQ"
}'

しかし、次のエラーが表示されます。

{"error":"IndexAlreadyExistsException[[spain_locales] already exists]","status":400}

CouchDB ドキュメントの例:

{
   "_id": "1",
   "_rev": "1-087ddbe8593f68f1d7d37a9c3f6de787",
   "Provincia": "Álava",
   "Poblacion": "Alegría-Dulantzi",
   "helper": ""
}

{
   "_id": "10",
   "_rev": "1-ce38dcdabeb3b34d34d2296c6e2fdf24",
   "Provincia": "Álava",
   "Poblacion": "Ayala/Aiara",
   "helper": ""
}

{
   "_id": "100",
   "_rev": "1-72e66601e378ee48519aa93601dc0717",
   "Provincia": "Albacete",
   "Poblacion": "Herrera (La)",
   "helper": "La Herrera"
}

PHP サービス プロバイダー/コントローラー:

public function searchzones(){

    $q = (Input::has('term')) ? Input::get('term') : 'null';

    $params['index'] = 'spain_locales';
    $params['type']  = 'spain_locales';

    $params['body']['query']['bool']['should'] = array(
        array('match' => array('Poblacion' =>  $q)),
        array('match' => array('Provincia' =>  $q))
    );

    $query = $this->elasticsearch->search($params);

    if ($query['hits']['total'] >= 1){

        $results = $query['hits']['hits'];

        foreach ($results as $zone) {
            
            $databag[] = array( "value"     => $zone['_source']['Poblacion'].', '.$zone['_source']['Provincia'],
                                "state"     => $zone['_source']['Provincia'],
                                "city"      => $zone['_source']['Poblacion'],
            );

        }

    } else {

        $results = ['res' => null];
        $databag[] = array();

    }

    return $databag;

    } // End Search Zones

jQuery (JavaScript):

// Sugest locations when user type in zones 
$(document).ready(function() {
    $('#zones').autocomplete({
            
            source : applink + 'ajax/searchzones',
            select : function(event, ui){
                console.log(ui);
            }
                
    }); // End autocomplete
}); // End Document ready

HTML フォーム部分 (Twitter Bootstrap):

<div class="form-group">
<div class="input-group input-append dropdown">
<input type="text" class="form-control typeahead" placeholder="City name" name="zones" id="zones">
<div class="input-group-btn" >
<button type="button" class="btn btn-default dropdown-toggle" data-toggle="dropdown"><span class="caret"></span></button>
<ul class="dropdown-menu dropdown-menu-right" id="dropZonesAjax">                           
</ul>
</div>
</div>
<div id="zonesAjax"></div>   
</div>

次のリソースを見つけました: http://www.elasticsearch.org/guide/en/elasticsearch/guide/current/asciifolding-token-filter.htmlしかし、それを実装/達成する方法がわかりません。

お時間を割いていただき、ありがとうございました。私の英語でごめんなさい!

4

1 に答える 1

0

インデックスを作成する前にマッピングを作成してみてください。次に、言及したアナライザー (折りたたみ) を定義し、それをフィールドに割り当てることができます。

{
  "settings": {
    "analysis": {
      "analyzer": {
        "folding": {
          "tokenizer": "standard",
          "filter": [
            "lowercase",
            "asciifolding"
          ]
        }
      }
    }
  },
  "mappings": {
    "locales": {
      "properties": {
        "Provincia": {
          "type": "string",
          "analyzer": "folding"
        },
        "Poblacion": {
          "type": "string",
          "analyzer": "folding"
        },
        "helper": {
          "type": "string"
        }
      }
    }
  }
}
于 2014-12-12T07:23:59.567 に答える