問題タブ [soundex]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
113 参照

python - パターンの予期しない終了

私は、soundex を使用して行のすべての単語をハッシュ バージョンに変換し、次に scikit-learn を使用して機械学習を実行しようとしています。

コードは次のとおりです。

しかし、私がそれをすると、エラーが発生します:

0 投票する
1 に答える
1026 参照

jpa - EclipseLink からの Soundex および CriteriaBuilder API の使用

現在、EclipseLink をプロバイダーとして CriteriaBuilder、Predicates、JPA 2.0 を使用してオブジェクト検索を作成中です。

私の課題は、soundex 機能にアクセスし、それを動的に構築された基準に適用することです。

...クエリへの入力のループ

... そして最後に

これは単純な基準ビルダー アイテムに対しては明らかにうまく機能し、「like」、「greaterThan」、日付比較などを使用できます。

EclipseLinkのsoundex()演算子を使用する式を使用できるようにしたいと考えています。EclipseLink プロバイダーを使用すると、eclipselink 式を作成できるようになりますが、それを述語に適用する方法がわかりません。

CriteriaBuilder で使用できる Expression を作成するためのドキュメントを見つけるのに苦労しました。出来ますか?EclipseLink 式をパラメータ化された永続性 Expression<> に変換できますか? ...そして、構築された基準クエリの述語として設定されますか?

0 投票する
1 に答える
870 参照

sql - 名前検索 SQL のファジー ロジックを作成する

rob や robert などの類似した名前に一致するファジー ロジックを作成しようとしています。これら 2 つの単語の SQL Soundex 関数は、より大きな違いを提供しており、役に立ちません。名前の一致を見つける別の方法はありますか。

0 投票する
4 に答える
2916 参照

r - MetaPhone 関数 (SoundEx など) 関数と R での使用?

MetaPhoneDouble MetaphoneCaverphone 、MetaPhone3、SoundExを使用したいと考えています。まだ誰かがそれを行っている場合は、 「R」内でNameX関数を使用して、同様の値を分類および要約して、分析前のデータ クレンジング操作を最小限に抑えることができます。

各アルゴリズムには独自の長所と短所があり、SoundEx を使用したくないことを十分に認識していますが、代替手段が見つからない場合でも機能する可能性があります。この投稿で述べた ように、 Harperは、SoundEx の下にある無関係な名前のリストのいずれかと一致しますが、より良い結果の一致のために Metaphone では一致しないはずです。

ある程度の柔軟性を維持しながら、どれが私の目的に最も適しているかはわかりませんが、値を確認する前に、それらのいくつかを試して、次のような表を生成したいのはそのためです。

ここに画像の説明を入力

表のソース リンク

姓は私の最初の分析の対象ではありませんが、同じ値として扱われる「響きのある」単語のようなすべてを効果的に検討したいので、これは良い例だと思います。 .

私がすでに見たいくつかのこと:

  • C パッケージを作成してRCppで呼び出すことができることは知っていますが、SEの SoundEx には C ソリューションもありますが、以前に R パッケージを作成したことがなく、より簡単な方法があれば車輪の再発明を避けたいと考えています。 Rで直接行うか、機能を利用できるパッケージが存在しますか?
  • RecordLinkageと現在のstringdistパッケージには SoundEx 関数がありますが、どの形式の MetaPhone 関数もありません。

だから私は具体的に答えを探しているのは、MetaPhone / CaverphoneがRでどのように機能し、「値」を知っているので、データ値をグループ化できるかということです。

追加の注意点は、私は R を毎日使用しているわけではないので、まだ R に慣れていないと考えていることです。

0 投票する
1 に答える
362 参照

search - カスタムアナライザーelasticsearch soundex plus snowball

私にとっては次のように機能します(「testing」を検索すると、「test」を含むフィールドも返されます): index : analysis : analyzer : default : type : snowball language : english elasticsearch.ymlファイルで設定した場合。

これをインストールしたsoundexと組み合わせたいので、これを試しました:

index : analysis : analyzer : default : type : custom tokenizer : standard filter : [standard, lowercase, soundex_filter, stemming] filter : soundex_filter : type : phonetic encoder : soundex replace : true stemming : type : snowball language : english

しかし成功せず、どれも機能していないようです (ステミングやサウンデックスはありません)

フィルターの組み合わせに成功した人はいますか?