Récupération

Supposons que vous ayez un modèle de représentation vectorielle continue. Comment choisiriez-vous les articles à recommander à un utilisateur ?

Lors de la diffusion, en fonction d'une requête, vous commencez par effectuer l'une des opérations suivantes:

  • Pour un modèle de factorisation matricielle, la représentation vectorielle continue de la requête (ou de l'utilisateur) est connue de manière statique. Le système peut simplement la rechercher à partir de la matrice de représentation vectorielle continue de l'utilisateur.
  • Pour un modèle de DNN, le système calcule la représentation vectorielle continue de la requête \(\psi(x)\)au moment de la diffusion en exécutant le réseau sur le vecteur de caractéristiques \(x\).

Une fois que vous avez obtenu la représentation vectorielle continue de la requête \(q\), recherchez les représentations vectorielles continues des éléments\(V_j\) qui sont proches de \(q\) dans l'espace de représentation vectorielle. Il s'agit du problème le plus proche. Par exemple, vous pouvez renvoyer les k premiers éléments en fonction du score de similarité \(s(q, V_j)\).

Image d'un spectre bidimensionnel avec plusieurs films et utilisateurs, des films pour enfants aux films pour adultes, des films d'art et d'essai aux blockbusters. Un utilisateur est mis en surbrillance, ainsi que deux films à proximité.

Vous pouvez suivre une approche similaire dans les recommandations pour les éléments associés. Par exemple, lorsque l'utilisateur regarde une vidéo YouTube, le système peut d'abord rechercher la représentation vectorielle continue de cet élément, puis rechercher les représentations vectorielles continues d'autres éléments qui se trouvent\(V_j\) dans l'espace de représentation vectorielle.

Récupération à grande échelle

Pour calculer les voisins les plus proches dans l'espace de représentation vectorielle, le système peut évaluer tous les candidats potentiels de manière exhaustive. L'attribution de scores exhaustifs peut être coûteuse pour des corpus très importants, mais vous pouvez utiliser l'une des stratégies suivantes pour la rendre plus efficace:

  • Si la représentation vectorielle continue de la requête est connue de manière statique, le système peut effectuer une notation hors connexion exhaustive, précalculer et stocker une liste des meilleurs candidats pour chaque requête. Il s'agit d'une pratique courante pour les recommandations d'éléments connexes.
  • Utilisez des voisins approximatifs.