問題タブ [name-matching]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
5 に答える
6808 参照

pattern-matching - 個人名に基づくマッチングレコード

2つの異なるデータソース間で人の名前を照合するために使用できるツールまたは方法はありますか?

システムには他の共通情報がなく、多くの場合、名前の入力方法が異なります。

完全に一致しない例:

キングジュニア、マーティンルーサー=キング、マーティン(サフィックスを除く)
アービング、ドクターJ. =アービング、J。(プレフィックスを除く)
オバマ、バラクフセイン=オバマ、バラク(ミドルネームを除く)
プフンストゥフ、HR =プフンストゥフ、ハイバネレンメイ(略語に一致)
Tankengine、Thomas = Tankengine、Tom(一般的なニックネームに一致)
Flair、Rick "the Natureboy" = Flair、Natureboy(ニックネームに一致)

0 投票する
2 に答える
459 参照

database - 人間の名前の検索/翻訳

私は、さまざまなデータベースの人々を照合するための要件に取り組んでいます。トリッキーな問題の1つは、Bob-Robert、Jim-James、Lizzy-Elizabethなどの名前がデータベース間で異なることです。

この種の要件に利用できるルックアップ/翻訳はありますか?

0 投票する
1 に答える
273 参照

grails - Grails でのテーブル、Web サービス データの結合

一致するロジックと入力検索条件に基づいて、結合されたテーブルを表示するための最良の方法を見つけようとしています。

状況は次のとおりです。

ローカルに保存された顧客のテーブルがあります。関心のあるフィールドは、ssn、名、姓、および生年月日です。

また、同じ情報を提供する Web サービスもあります。Web サービスの顧客の中には、ローカル ファイルと同じものもあれば、異なるものもあります。

どちらもSSNは必須ではありません。

Grails ディスプレイで表示するには、このデータを結合する必要があります。

組み合わせの基準は、1) SSN で一致することです。2) 残りの記録については、名、姓、生年月日が完全に一致していること。

この時点では、soundex や近似論理は必要ありません。

私がすべきことは、両方の入力からすべてのレコードを単一のコレクションに抽出し、どういうわけかそれを SSN のセットにすることです。次に、空白の ssn を削除します。

これにより、SSN マッチングが処理されます (それをセットにする方法がわかったら)。

次に、元の 2 つの入力ソース (再読み取りを防ぐためにコレクションにキャッシュされている) に戻り、以前に派生した SSN セットに存在するすべてのレコードを削除する必要があります。

次に、名、姓、生年月日に基づいて別のセットを作成します-セットの作成方法がわかれば、もう一度。

次に、2 つの派生コレクションを 1 つのコレクションに結合します。コレクションは、表示のためにソートする必要があります。

これは理にかなっていますか?検索条件によって取り込まれるレコードの数が制限されるため、メモリ内でこれを行うことができると思います。

基本的に、上記のロジックを実現するために Grails コードがどのように見えるかについて、いくつかのアイデアを探しています (これが適切なアプローチであると仮定します)。ローカルの顧客テーブルはドメイン オブジェクトですが、WS から取得するのはオブジェクトの配列リストです。

また、maxresults、firstResult、および表示に使用される順序がどのように影響を受けるかについては、完全にはわかりません。最初に検索条件に一致するすべてのレコードを読み込み、結合を行い、派生コレクションから表示する必要があると思います。

0 投票する
1 に答える
370 参照

php - 代替スペルを使用したテーブルとの名前の照合

国名の代替スペルの表があります。

名前、Alt1、Alt2、Alt3、Alt4を使用
[...]
バハマ、 "バハマ、"
ボリビア
ボスニアヘルツェゴビナ、ボスニア&ヘルツェゴビナ
[...]

(一部の国では代替スペルが0で、その他は最大4つです。)

国の文字列が与えられた場合、最初の列の要素を返すためのパフォーマンス面での最良の解決策は何ですか?(ほとんどの場合、代替スペルの数に関係なく、文字列は最初の列と一致し、名前を一致させる必要はありません。その他の場合、確率は列2-Xに均等に分散されます。

(できればJavaScriptまたはPHPで、ありがとう:))

0 投票する
1 に答える
2074 参照

dictionary - 姓と名のバリエーションを検索するための名前一致辞書

訪問者を保存および追跡するアプリケーションがあります。これらの訪問者は、訪問を設定するときに、必要に応じてスケジューラ (ユーザー) によってシステムで作成されます。問題は、ほとんどの場合、訪問者の重要な一意の識別子は次のとおりであることです。

  • ファーストネーム
  • 苗字
  • 会社名

同じ人物のレコードが重複して存在するリスクはつきものです。スケジューラは、その名前で存在する人物をシステムで検索する代わりに、新しい訪問者レコードを入力することがあります。

同じ名前の訪問者に誰かが入ってくるのに遭遇すると、この人物が誰であるかについてさまざまな提案を含む警告ダイアログを表示しますが、それでも十分ではありません。

「Jim Jones」と入力すると、この人物は「James Jones」または「Jimmy Jones」としてシステムに存在する可能性があります。利用可能な名前認識ソフトウェア パッケージがあるようですが、それらは高価であり、私が探しているものよりも確かに重いです。

潜在的な名前のバリエーションを見つけるためにプログラムでアクセスできる無料またはオープンソースの辞書ファイルの場所を誰か知っていますか? ソフトウェアやオンライン サービスもいいですが、データ ダンプや単純なテキスト ファイルでもいいかもしれません。

これでも訪問者レコードの重複を防ぐことはできませんが、それを最小限に抑えようとしているだけなので、重要な機能ではありません.

0 投票する
2 に答える
419 参照

c# - 人の名前に基づいて提案を行う

だから私はあいまい検索、レーベンシュタイン距離アルゴリズムを検索しましたが、どちらも私がやっていることに本当に合っているかどうかはわかりません. 感想などありましたら教えてください...

ユーザーのフルネームを取得して、類似した名前のリストを生成するにはどうすればよいですか? アカウントを作成する前の最後のステップとして、ユーザーがアプリケーションで複数のアカウントを作成できないようにしたいと考えています。

この記事を見つけましたが、完全に SQL ベースです (http://stackoverflow.com/questions/988050/matching-records-based-on-person-name)

私はc#/Linq、SqlServerを使用しています。

御時間ありがとうございます!

0 投票する
6 に答える
6794 参照

jquery - jQuery および ASP.NET ユーザー コントロールを使用するときに要素 ID を処理する方法

ASP.NET には、単純な HTML として使用しているユーザー コントロールがいくつかあります。つまり、コード ビハインドはありません。

私は 1 つのコントロールに固定 ID の要素があり、いくつかの jQuery クライアント スクリプトでそれを指しています。例えば:

これは問題なく非常にうまく機能します。しかし、これには副作用があります。実際、ページに同じユーザー コントロールの 2 つのインスタンスを追加すると、同じ ID を持つ 2 つの要素が作成されます。

このような状況に対処するための良い方法はどれだと思いますか?

ありがとう

0 投票する
1 に答える
546 参照

java - Java の名前に一致するテキスト

キャプテンがチームをトーナメントに登録できるスポーツ アプリケーションがあります。1 年に複数のトーナメントが開催される可能性があり、各トーナメントには登録が必要です。今、私は登録プロセスで以下をサポートしたいと思います

  1. プレーヤーが以前のトーナメントにすでに参加している場合、アプリは登録を強制するのではなく、既存の詳細を再利用する必要があります。
  2. プレーヤーが 2 つのチームでプレーしていないことを確認する必要があります。

名前の一致機能をどのように実装するのが最善なのか疑問に思っています。違いがあれば、ほとんどの名前はインド起源です。

データストアとして Neo4j を使用しています。

0 投票する
0 に答える
960 参照

r - SAS で SPEDIS を置き換える R 関数

SASのSPEDIS関数は次のようにコストを計算します(例):

ここに画像の説明を入力

まったく同じことをするR関数を探しています。助けが必要。