CosineSimilarity
Renvoie la similarité entre deux vecteurs d'intégration sous la forme d'un nombre compris entre -1 (opposé) et 1 (similaire).
Format
CosineSimilarity ( v1 ; v2 )
Paramètres
v1
et v2
: toute expression de type texte, rubrique de type texte ou rubrique Conteneur qui contient des vecteurs d'intégration.
Résultat
Nombre
Provient de la version
21.0
Description
Cette fonction renvoie une mesure de la similitude entre deux vecteurs d'intégration à l'aide de la méthode du cosinus. Pour les vecteurs d'intégration, la similarité cosinus donne une mesure utile de la similitude potentielle entre deux valeurs de texte. Les résultats varient de -1 à 1 (compris). Des valeurs plus proches de 1 indiquent une plus grande similitude sémantique. 0 indique une absence de similitude et -1 indique une différence.
Si v1 et v2 sont du texte, ils doivent se présenter sous la forme de tableaux JSON. Les vecteurs doivent également avoir les mêmes dimensions (le nombre d'éléments dans les tableaux doit être le même). Généralement, l'utilisation de vecteurs d'intégration en tant que données de conteneurs binaires améliore les performances.
Remarques
-
Des vecteurs d'intégration normalisés sont nécessaires. Tous les vecteurs d'intégration doivent être générés à partir du même modèle pour garantir une compatibilité et des performances optimales ; le mélange de vecteurs d'intégration depuis différents modèles n'est pas pris en charge.
Exemple 1
CosineSimilarity ( "[-0.043686170000000003333, 0.042094484000000001456, ... ]" ; "[-0.049242082999999998993, 0.040926795000000001923, ... ]" )
renvoie ,90848158767415143622 pour un modèle spécifique.
Exemple 2
CosineSimilarity ( v1 ; v2 )
renvoie ,54682693950088512302 pour un modèle spécifique lorsque les rubriques v1 et v2 contiennent des vecteurs d'intégration pour le texte « Claris » et « Claire », respectivement.