問題タブ [doc2vec]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
doc2vec - doc2vec を使用して行テキストの列から製品名を特定する
行テキストの列があります。行テキストの列から、製品名のリストに似た名前を見つけます。問題を解決するためにDoc2Vecを使用していました。しかし、私の結果はかなり悪いものでした。この問題に対する正しいアプローチはどれですか?
私のデータは次のとおりです: LINE TEXT: パレット 10kg のチキン ウェルドコート メタル ロジスティクス 100 番目のメイン、ボルルヴェドール アベニュー 19 番目のメイン ST ジョン 5670987
最も類似した名前を取得するために使用している製品のリストは、mat_subset=[英国サイズ 10 の靴、スーパードライ トリム、重量 10kg の箱、パレットなど] です。
私の行テキストは、かなりまともなOCR出力です。私が使用したDoc2Vecコードは次のとおりです。
これは私が使用したコードです。ここで、mat_subset は製品名のリストです。私はPythonにかなり慣れていません。何か間違ったことをしている場合は修正してください