問題タブ [sentence-similarity]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
167 参照

word2vec - Mikolov 2014 Paragraph2Vec モデルは文の順序を想定していますか?

Paragraph2Vectors に関する Mikolov 2014 の論文 ( https://arxiv.org/pdf/1405.4053v2.pdf ) で、著者は PV-DM と PV-DBOW の両方で、文の順序が意味をなす必要があると想定していますか?

一連のツイートを処理していて、各ツイートが 1 つの段落であると想像してください。段落/ツイートには順序関係があるとは限りません。トレーニング後、段落のベクトル埋め込みはまだ意味がありますか?

0 投票する
0 に答える
129 参照

string - 同様の文字列マッチング アルゴリズム: Jaccard、Dice、Cosine、および Exact

2 つの英文の類似点を見つけようとしています。Jaccard、Dice、Exact、および Cosine の文字列マッチングアルゴリズムの中で、文字列のマッチングや近さの判断に最適なのはどれですか?

文 1 : tmart.com での電化製品、コンピューター部品、Apple アクセサリー、健康と美容、ビデオ ゲーム、携帯電話アクセサリー、家庭と庭などのオンライン ショッピング。私たちは、世界中の送料無料で最高の価格で幅広い製品を提供しています。

文 2 : Flipkart アプリを使用して電化製品、アパレルなどを購入 送料無料 & 代金引換。

0 投票する
1 に答える
1104 参照

word2vec - 文を埋め込み表現に変換する

文があるとしたら、例: 「ここから出て行け」そして、word2vec 埋め込みを使用したい。それを表すために..それを行う3つの異なる方法を見つけました:

1- 各単語について、その埋め込みベクトルの AVG を計算するため、各単語は単一の値に置き換えられます。

2- 1 と同様ですが、埋め込みベクトル値の標準偏差を使用します。

3- または埋め込みを追加します。ベクトルそのまま。したがって、上記の例で長さ 300 の埋め込みベクトルを使用すると、文を表す最終的なベクトルとして (300 * 4 語) の長さ 1200 のベクトルが最終的に含まれます。

それらのどれが最も適しています.. ? 具体的には、文の類似性アプリケーション..

0 投票する
1 に答える
47 参照

python - 2 つの列で 2 つのデータフレームをマージする

私は2つのデータフレームを持っています:

dfBB

ランク、歌、アーティスト、年

およびdfMap

アーティスト、曲、SongId、ArtistId

アーティストとソングに基づいてそれらをマージしたいと思います。つまり、それらが一致する場合は余分な列を追加します。それ以外の場合は 0:

アーティスト、曲、SongId、ArtistId、ランク、年

アーティストまたは曲の綴りが間違っている可能性がある別の問題を予見しています。類似性を確認できますか?どうすればいいのかわからない。

私が試したマージのために:

しかし得た: