2

次のコードでデータセットを作成しています:

from lightfm.data import Dataset
from lightfm import LightFM

dataset = Dataset()


dataset.fit((row['id'] for row in user_queryset.values()),
            (row['id'] for row in item_queryset.values()))


num_users, num_items = dataset.interactions_shape()


(interactions_sparse_matrix, weights) = dataset.build_interactions(
        (
            (
                row['user_id']
                ,row['item_id']
                ,row['weight']
            )
        )
        for row in queryset.values()
    )

dataset.fit_partial(
    items=(x['item_id'] for x in items_list),
    item_features=(x['feature_id'] for x in item_features_list)
    )
dataset.fit_partial(
    users=(x['user_id'] for x in users_list),
    user_features=(x['feature_id'] for x in user_features_list)
    )
item_features = dataset.build_item_features(
    ((x['item_id'], [x['property_id']])
    for x in item_features_list))
user_features = dataset.build_user_features(
    ((x['user_id'], [x['property_id']])
    for x in user_features_list))

そして、次の方法で列車モデルを生成します。

model = LightFM(loss='bpr')
model.fit(
        interactions_sparse_matrix
        ,item_features=item_features
        ,user_features=user_features
        )

次に、cosine_similarityメソッドを使用sklearnして類似性を取得します。

from scipy import sparse
from sklearn.metrics.pairwise import cosine_similarity
import numpy as np

users_sparse_matrix = sparse.csr_matrix(users_embed)
similarities = cosine_similarity(users_sparse)

しかし、similarities.shapeそのリターンを印刷するとき:

(14, 14)

私には5人のユーザーがいて、それは (5,5) でなければならないと思いますが、間違っていますか? このマトリックスのようなもの:

1    0.2   0.8    0.4    0.6
0.2   1    ...    ...    ...
0.8  ...    1     ...    ...
0.4  ...   ...     1     ...
0.6  ...   ...    ...     1

ユーザーとそのスコアをユーザーに推奨するにはどうすればよいですか? ありがとう

私の LightFM バージョンは: 1.15

そして、私はpython 3.6を使用しています

4

1 に答える 1

3

問題はあなたのコードではありません。user_embedding の概念には誤解があります。user_embedding マトリックスは、ユーザー フィーチャの数を行として、コンポーネントの数を列として持つマトリックスです。このマトリックスがある場合、各ユーザー間の類似度をコサイン類似度で取得するには、user_feature マトリックスに user_embedding を乗算し、最後に user_feature マトリックスと user_embedding マトリックスの内積のコサイン類似度を計算する必要があります。

于 2019-02-18T17:33:11.467 に答える