CosineSimilarity
Retourneert de gelijkenis tussen twee insluitvectoren als een getal tussen -1 (tegenovergesteld) en 1 (vergelijkbaar).
Opmaak
CosineSimilarity ( v1 ; v2 )
Parameters
v1
en v2
- een tekstexpressie, tekstveld of containerveld dat insluitvectoren bevat.
Resulterend gegevenstype
getal
Afkomstig uit versie
21.0
Beschrijving
Deze functie retourneert een maat voor de gelijkenis tussen twee insluitvectoren met behulp van de cosinusmethode. Voor insluitvectoren geeft cosinusgelijkenis een nuttige maatstaf voor hoe vergelijkbaar twee tekstwaarden waarschijnlijk zijn. De resultaten variëren van -1 t/m 1, waarbij waarden dichter bij 1 voor een hogere semantische gelijkenis, 0 voor geen gelijkenis en -1 voor verschillen staan.
Als v1 en v2 tekst zijn, moeten ze de vorm hebben van JSON arrays. De vectoren moeten ook dezelfde afmetingen hebben (het aantal elementen in de arrays moet hetzelfde zijn). Meestal echter verbetert het gebruik van insluitvectoren als binaire containergegevens de prestaties.
Opmerkingen
-
Genormaliseerde insluitvectoren zijn vereist. Alle insluitvectoren moeten worden gegenereerd op basis van hetzelfde model om compatibiliteit en prestaties te garanderen; het mengen van insluitvectoren van verschillende modellen wordt niet ondersteund.
Voorbeeld 1
CosineSimilarity ( "[-0.043686170000000003333, 0.042094484000000001456, ... ]" ; "[-0.049242082999999998993, 0.040926795000000001923, ... ]" )
retourneert .90848158767415143622 voor een bepaald model.
Voorbeeld 2
CosineSimilarity ( v1 ; v2 )
retourneert .54682693950088512302 voor een bepaald model wanneer de velden v1 en v2 insluitvectoren bevatten voor respectievelijk de tekst "Claris" en "Claire,".