1
          ios d.0 d.1 d.2 d.3 d.4 d.5
1   190371877 HDa 2Pb   2 BxU BuQ Bve
2   190890807 HCK 2Pb   2  09   F   G
3   193999742 HDa 2Pb   2 1wL 1ye    
4   192348099 HDa 2Pb   2 2WP        
5   194907960 HDa 2Pb   2   Y   F   G
6   194306872 HDa 2Pb   2 2WP        
7   190571682 HDa 2Pb   2   i   F   C
8   195878080 HDa 2Pb   2   Y   F   G
9   195881580 HDa 2Pb   2   Y   F   G
10  193746161 HDa 2Pb   2 1wL     

以下は私のコードです。2つのベクトルを比較することができたので、関数を構築したいと思います

library('lsa')
td = tempfile()
dir.create(td)
write( c("HDa","2Pb","2","BxU","BuQ","Bve"), file=paste(td, "D1", sep="/"))
write( c("HCK","2Pb","2","09","F","G"), file=paste(td, "D2", sep="/"))


myMatrix = textmatrix(td, minWordLength=1)
res <- lsa::cosine(myMatrix[,1], myMatrix[,2])
res
#0.3333

上記のような 266 行 7 列のマトリックスがあります。最初の列は製品の ID で、他の列は製品の決定的なタグです。独自の関数を持ち、2 つの入力を与えたい場合は、決定的なタグ ベクトル (c("HDa","2Pb","2","BxU","BuQ","Bve") など) とother は製品 ID (ios) です。その結果、製品 ID のベクトルに最も類似した上位 8 製品の中で true または false (1 または 0) を確認したいと考えています。

私の問題を解決するために何をすべきかについて、誰かが私に手がかりを与えることができますか?

4

0 に答える 0