Effectue une extraction de la représentation vectorielle continue du texte.
Cette API attend un modèle TFLite avec des métadonnées de modèle TFLite (facultatives).
Des métadonnées sont requises pour les modèles avec des Tensors d'entrée int32, car elles contiennent l'unité de processus d'entrée pour le Tokenizer du modèle. Aucune métadonnée n'est requise pour les modèles avec des Tensors d'entrée de chaîne.
- Tensors d'entrée
- Trois Tensors d'entrée (
kTfLiteInt32
) de forme[batch_size x bert_max_seq_len]
représentant les ID d'entrée, les ID de masque et les ID de segment. Cette signature d'entrée nécessite une unité de processus BERT Tokenizer dans les métadonnées du modèle. - Ou un Tensor d'entrée (
kTfLiteInt32
) de forme[batch_size x max_seq_len]
représentant les ID d'entrée. Cette signature d'entrée nécessite une unité de processus Regex Tokenizer dans les métadonnées du modèle. - Soit un Tensor d'entrée (
kTfLiteString
) sans forme ou dont la forme est[1]
, qui contient la chaîne d'entrée.
- Trois Tensors d'entrée (
- Au moins un Tensor de sortie (
kTfLiteFloat32
/kTfLiteUint8
) de forme[1 x N]
, où N correspond au nombre de dimensions des représentations vectorielles continues produites.
Classes imbriquées
classe | TextEmbedder.TextEmbedderOptions | Options de configuration d'un TextEmbedder . |
Méthodes publiques
void |
close()
Ferme et nettoie
TextEmbedder . |
double statique |
cosineSimilarity(représentation vectorielle continue u, représentation vectorielle continue v)
Fonction utilitaire permettant de calculer la similarité cosinus entre deux objets
Embedding . |
statique TextEmbedder |
createFromFile(contexte de contexte, String modelPath)
Crée une instance
TextEmbedder à partir d'un fichier de modèle et de la valeur TextEmbedder.TextEmbedderOptions par défaut. |
statique TextEmbedder |
createFromFile(contexte de contexte, File modelFile)
Crée une instance
TextEmbedder à partir d'un fichier de modèle et de la valeur TextEmbedder.TextEmbedderOptions par défaut. |
statique TextEmbedder |
createFromOptions(contexte, options TextEmbedder.TextEmbedderOptions)
Crée une instance
TextEmbedder à partir de TextEmbedder.TextEmbedderOptions . |
TextEmbedderResult |
Méthodes héritées
Méthodes publiques
public statique double cosineSimilarity (représentation vectorielle continue u, représentation vectorielle continue v)
Fonction utilitaire permettant de calculer la similarité cosinus entre deux objets Embedding
.
Paramètres
u | |
---|---|
v |
Génère
IllegalArgumentException | si les représentations vectorielles continues sont de types différents (nombre à virgule flottante ou quantifiée), ont des tailles différentes ou ont une norme L2 de 0. |
---|
public statique TextEmbedder createFromFile (contexte de contexte, String modelPath)
Crée une instance TextEmbedder
à partir d'un fichier de modèle et de la valeur TextEmbedder.TextEmbedderOptions
par défaut.
Paramètres
context | un ERROR(/Context) Android. |
---|---|
modelPath | Chemin d'accès au modèle textuel avec les métadonnées dans les éléments. |
Génère
si une erreur se produit lors de la création de TextEmbedder .
|
public statique TextEmbedder createFromFile (contexte de contexte, File modelFile)
Crée une instance TextEmbedder
à partir d'un fichier de modèle et de la valeur TextEmbedder.TextEmbedderOptions
par défaut.
Paramètres
context | un ERROR(/Context) Android. |
---|---|
modelFile | l'instance de modèle textuel File . |
Génère
IOException | si une erreur d'E/S se produit lors de l'ouverture du fichier de modèle tflite. |
---|---|
si une erreur se produit lors de la création de TextEmbedder .
|
public statique TextEmbedder createFromOptions (contexte de contexte, options TextEmbedder.TextEmbedderOptions)
Crée une instance TextEmbedder
à partir de TextEmbedder.TextEmbedderOptions
.
Paramètres
context | un ERROR(/Context) Android. |
---|---|
options | une instance TextEmbedder.TextEmbedderOptions . |
Génère
si une erreur se produit lors de la création de TextEmbedder .
|
public TextEmbedderResult embed (String inputText)
Effectue une extraction de la représentation vectorielle continue du texte d'entrée.
Paramètres
inputText | String pour le traitement.
|
---|