問題タブ [name-matching]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
5164 参照

python - Python での名前マッチング

類似した名前を見つけて、2 つの名前の類似性スコアを割り当てるサード パーティ製の「ツール」があります。

ツールの動作を可能な限り厳密に模倣することになっています。インターネットで検索した後、距離法を試してみました。同じためにfuzzywuzzyを使用しました。

ツールの結果に近い結果が得られましたが、以下に強調表示されているように、外れ値はほとんどありません。

ここに画像の説明を入力

インターネットでさらに検索した結果、さらに改良するにはある種の機械学習の実装が必要になることがわかりました。私は機械学習の世界ではまったくの初心者です。そのため、コードをさらに改良するために次にどこに取り組めばよいかアドバイスを求めています。

ありがとう!

0 投票する
1 に答える
292 参照

python - ネームマッチング。sparse_dot_topn 関数を実行すると、警告が表示されます: Kernel Restarted?

awesome_cossim_top を介してコサイン類似度を使用して、当社の会社名を政府の会社名のデータベースと照合しようとしています。そのため、ngrams tf-idf を CSR マトリックスに変換し、関数を実行します。すべての IDE (Colab、Spyder、PyCharm、および Jupyter) でカーネルが実行されず、再起動されます。それは単に機能していません。理由を理解したいですか?

0 投票する
1 に答える
73 参照

r - 列名が r データフレームの各行の 2 つの変数の値と一致するベクトルを関連付ける

私はこのデータフレームをr(リンク)に持っています(以下の行と列の例)

各行の値が相関の結果である新しい変数 df$cor を追加したいと思います。相関関係は 2 つのベクトル間である必要があります: (1) colname がその行の変数 df$FocalID の値に対応する列、および (2) colname がその行の変数 df$Mother の値に対応する列.

母親の名前に一致する列に対応するベクトルが存在しない場合 (母親が不明なため (df$Mother の NA)、または colnames に存在しないため)、相関は NA を生成する必要があります。

次のコードを試しました:

しかし、結果は正しくないようです。何か案が?

0 投票する
0 に答える
30 参照

r - おそらく R 3.6.3 での 3 ドット引数の使用のバグ

...R 3.6.3 で関数引数を渡すために使用するためのバグのようです。具体的には、名前付き引数は...、完全一致ではなく、部分一致を試みます。次に例を示します。

R 3.6.3 の出力は次のようになります。