1

word2vec と組み合わせて使用​​される「ネガティブ サンプリング」および「サブ サンプリング」という用語をよく耳にします。

word2vec をいじる前に、単語の埋め込みについて言及している論文をさかのぼって、最初からやり直そうとしています。紙の道は私をここに上陸させました:

https://gul.gu.se/public/pp/public_courses/course77642/published/1497871737091/resourceId/37659332/content/UploadedResources/lecture10-slides-word2vec_sungmin_VT17.pdf (Google は、「ベクトル空間における単語表現の効率的な推定」 " リンクを信頼しない場合。)

そして次のように述べています。

ここに画像の説明を入力

(最初の箇条書きを除いたすべての箇条書きに精通しています)

ネガティブ サンプリングとサブサンプリングに関して私が見つけた唯一のものは、word2vec に関する記事に含まれており、それは私が避けようとしているものです。

誰かがこれらの用語を説明したり、私を正しい方向に向けたりすることができれば、それは大歓迎です:)。

編集:サブサンプリングタグ自体がこの定義につながります:

「サブサンプリングは、(教科書のブートストラップ法で使用される元のサンプル サイズと比較して) すべての観測よりも少ない数の観測が置換で描画されるブートストラップに似たリサンプリング手順です。既存のデータからサンプルを作成するには、「サンプリング」を検討してください。代わりにタグを付けてください。」--- これの具体例は素晴らしいでしょう。

4

1 に答える 1