Présentation de Vertex AI Feature Store (ancien)

Vertex AI Feature Store fournit un dépôt centralisé pour l'organisation, le stockage et la publication des caractéristiques de ML. En utilisant un magasin de caractéristiques central, votre organisation peut partager, découvrir et réutiliser efficacement des caractéristiques de ML à grande échelle, ce qui peut augmenter la vitesse de développement et de déploiement de nouvelles applications de ML.

Vertex AI Feature Store (ancien) est une solution entièrement gérée, qui gère et fait évoluer l'infrastructure sous-jacente, comme les ressources de stockage et de calcul. Cette solution signifie que les data scientists peuvent se concentrer sur la logique de calcul des caractéristiques, au lieu de s'inquiéter des difficultés liées au déploiement des caractéristiques en production.

Vertex AI Feature Store (ancien) est une fonctionnalité intégrée de Vertex AI. Vous pouvez utiliser Vertex AI Feature Store (ancien) de manière indépendante ou avec les workflows de Vertex AI. Par exemple, vous pouvez récupérer des données de Vertex AI Feature Store (ancien) pour entraîner des modèles personnalisés ou AutoML dans Vertex AI.

Vertex AI Feature Store (ancien) est le prédécesseur de Vertex AI Feature Store. Pour en savoir plus sur Vertex AI Feature Store, consultez la documentation sur Vertex AI Feature Store.

Présentation

Utilisez Vertex AI Feature Store (ancien) pour créer et gérer des magasins de caractéristiques, des types d'entités et des caractéristiques. Un featurestore est un conteneur de premier niveau pour vos caractéristiques et leurs valeurs. Lorsque vous configurez un featurestore, les utilisateurs autorisés peuvent ajouter et partager leurs caractéristiques sans assistance technique supplémentaire. Les utilisateurs peuvent définir des caractéristiques, puis importer (ingérer) des valeurs de caractéristiques à partir de différentes sources de données. En savoir plus sur le modèle de données et les ressources de Vertex AI Feature Store (ancien).

Tout utilisateur autorisé peut rechercher et récupérer des valeurs à partir du featurestore. Par exemple, vous pouvez découvrir des caractéristiques, puis effectuer une exportation par lots afin d'obtenir des données d'entraînement pour la création de modèles de ML. Vous pouvez également récupérer des valeurs de caractéristiques en temps réel pour effectuer des prédictions en ligne rapidement.

Avantages

Avant d'utiliser Vertex AI Feature Store (ancien), vous auriez peut-être calculé des valeurs de caractéristiques et les auriez enregistrées à différents emplacements, tels que des tables dans BigQuery et des fichiers dans Cloud Storage. De plus, vous auriez peut-être créé et géré des solutions distinctes pour le stockage et la consommation de valeurs de caractéristiques. En revanche, Vertex AI Feature Store (ancien) fournit une solution unifiée pour le stockage par lots et en ligne, ainsi que la diffusion de caractéristiques de ML. Les sections suivantes détaillent les avantages offerts par Vertex AI Feature Store (ancien).

Partager des fonctionnalités dans l'ensemble de votre organisation

Si vous produisez des caractéristiques dans un featurestore, vous pouvez rapidement les partager avec d'autres utilisateurs à des fins d'entraînement ou de diffusion. Les équipes n'ont pas besoin de repenser l'ingénierie de fonctionnalités pour différents projets ou cas d'utilisation. En outre, comme vous pouvez gérer et diffuser des caractéristiques à partir d'un dépôt central, vous pouvez maintenir la cohérence au sein de votre organisation et réduire les efforts inutiles, en particulier pour les caractéristiques à forte valeur ajoutée.

Vertex AI Feature Store (ancienne version) offre des fonctions de recherche et de filtrage qui permettent aux autres utilisateurs de découvrir et de réutiliser des caractéristiques existantes. Pour chaque caractéristique, vous pouvez consulter les métadonnées pertinentes pour déterminer la qualité et les modèles d'utilisation de la caractéristique. Par exemple, vous pouvez afficher la fraction des entités qui ont une valeur valide pour une caractéristique (également appelée couverture des caractéristiques) et la distribution statistique des valeurs de caractéristiques.

Solution gérée pour une diffusion en ligne à grande échelle

Vertex AI Feature Store (ancien) fournit une solution gérée pour la publication de caractéristiques en ligne (diffusion à faible latence), ce qui est essentiel pour réaliser des prédictions en ligne en temps opportun. Vous n'avez pas besoin de créer ni d'exploiter une infrastructure de diffusion de données à faible latence. Vertex AI Feature Store (ancien) effectue cette opération à votre place et évolue selon vos besoins. Vous codez la logique pour générer des caractéristiques, mais déchargez la tâche de diffusion des caractéristiques. Tout cela, y compris la gestion, simplifie la création de nouvelles fonctionnalités pour permettre aux data scientists de travailler sans se soucier du déploiement.

Atténuer le décalage entraînement/diffusion

Un décalage entraînement/diffusion se produit lorsque la distribution des données de caractéristiques que vous utilisez en production diffère de la distribution des données de caractéristiques qui a été utilisée pour entraîner votre modèle. Ce décalage entraîne souvent des écarts entre les performances d'un modèle pendant l'entraînement et ses performances en production. Les exemples suivants montrent comment Vertex AI Feature Store (ancien) peut traiter les sources potentielles de décalage entraînement/diffusion :

  • Vertex AI Feature Store (ancien) garantit qu'une valeur de caractéristique est importée une fois dans un magasin de fonctionnalités et qu'elle est réutilisée à la fois pour l'entraînement et la diffusion. Sans featurestore, vous pouvez disposer de chemins de code différents pour générer des caractéristiques entre l'entraînement et la diffusion. Ainsi, les valeurs des caractéristiques peuvent différer entre l'entraînement et la diffusion.
  • Vertex AI Feature Store (ancien) fournit des recherches à un moment précis pour extraire les données de l'historique pour l'entraînement. Grâce à ces recherches, vous pouvez limiter les fuites de données en récupérant uniquement les valeurs de caractéristiques disponibles avant une prédiction et non après.

Pour en savoir plus sur la détection d'un décalage entraînement/diffusion, consultez la section Afficher les anomalies liées aux valeurs des caractéristiques.

Détecter la dérive

Vertex AI Feature Store (ancien) vous permet de détecter l'évolution importante de votre distribution des données de caractéristiques au fil du temps, également appelée dérive. Vertex AI Feature Store (ancien) surveille en permanence la distribution des valeurs de caractéristiques importées dans le magasin de caractéristiques. À mesure que la dérive des caractéristiques augmente, vous devrez peut-être réentraîner les modèles qui utilisent les caractéristiques concernées. Pour en savoir plus sur la détection de la dérive, consultez la section Afficher les anomalies liées aux valeurs des caractéristiques.

Quotas et limites

Vertex AI Feature Store (ancien) applique des quotas et des limites pour vous aider à gérer les ressources en définissant vos propres limites d'utilisation et pour protéger la communauté des utilisateurs de Google Cloud en empêchant les pics d'utilisation imprévus. Pour vous éviter d'atteindre des contraintes non planifiées, consultez les quotas de Vertex AI Feature Store (ancien) sur la page Quotas et limites. Par exemple, Vertex AI Feature Store (ancien) définit un quota sur le nombre de nœuds de diffusion en ligne et un quota sur le nombre de requêtes de diffusion en ligne que vous pouvez effectuer par minute.

Conservation des données

Vertex AI Feature Store (ancien) conserve les valeurs des caractéristiques jusqu'à la limite de conservation des données. Cette limite est basée sur l'horodatage associé aux valeurs de la caractéristique, et non sur la date d'importation des valeurs. Vertex AI Feature Store (ancien) planifie la suppression des valeurs dont l'horodatage dépasse la limite.

Tarifs

Les tarifs de Vertex AI Feature Store (ancien) sont basés sur plusieurs facteurs, tels que la quantité de données que vous stockez et le nombre de nœuds en ligne du magasin de caractéristiques que vous utilisez. Vous ne serez facturé que lorsque vous aurez créé un featurestore. Pour en savoir plus, consultez la page Tarifs de Vertex AI Feature Store (ancien).

Étapes suivantes