問題タブ [doc2vec]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

521 問題

0 投票する

1 に答える

74 参照

doc2vec - doc2vec を使用して行テキストの列から製品名を特定する

行テキストの列があります。行テキストの列から、製品名のリストに似た名前を見つけます。問題を解決するためにDoc2Vecを使用していました。しかし、私の結果はかなり悪いものでした。この問題に対する正しいアプローチはどれですか?

私のデータは次のとおりです: LINE TEXT: パレット 10kg のチキンウェルドコートメタルロジスティクス 100 番目のメイン、ボルルヴェドールアベニュー 19 番目のメイン ST ジョン 5670987

最も類似した名前を取得するために使用している製品のリストは、mat_subset=[英国サイズ 10 の靴、スーパードライトリム、重量 10kg の箱、パレットなど] です。

私の行テキストは、かなりまともなOCR出力です。私が使用したDoc2Vecコードは次のとおりです。

これは私が使用したコードです。ここで、mat_subset は製品名のリストです。私はPythonにかなり慣れていません。何か間違ったことをしている場合は修正してください

doc2vec

2017-07-19T11:10:05.847

1 2 3 4 5 6 7 8 9 10

問題タブ [doc2vec]

doc2vec - doc2vec を使用して行テキストの列から製品名を特定する

Reference