CosineSimilarity

Retourneert de gelijkenis tussen twee insluitvectoren als een getal tussen -1 (tegenovergesteld) en 1 (vergelijkbaar).

Opmaak 

CosineSimilarity ( v1 ; v2 )

Parameters 

v1 en v2 - een tekstexpressie, tekstveld of containerveld dat insluitvectoren bevat.

Resulterend gegevenstype 

getal

Afkomstig uit versie 

21.0

Beschrijving 

Deze functie retourneert een maat voor de gelijkenis tussen twee insluitvectoren met behulp van de cosinusmethode. Voor insluitvectoren geeft cosinusgelijkenis een nuttige maatstaf voor hoe vergelijkbaar twee tekstwaarden waarschijnlijk zijn. De resultaten variëren van -1 t/m 1, waarbij waarden dichter bij 1 voor een hogere semantische gelijkenis, 0 voor geen gelijkenis en -1 voor verschillen staan.

Als v1 en v2 tekst zijn, moeten ze de vorm hebben van JSON arrays. De vectoren moeten ook dezelfde afmetingen hebben (het aantal elementen in de arrays moet hetzelfde zijn). Meestal echter verbetert het gebruik van insluitvectoren als binaire containergegevens de prestaties.

Opmerkingen 

  • Genormaliseerde insluitvectoren zijn vereist. Alle insluitvectoren moeten worden gegenereerd op basis van hetzelfde model om compatibiliteit en prestaties te garanderen; het mengen van insluitvectoren van verschillende modellen wordt niet ondersteund.

Voorbeeld 1 

CosineSimilarity ( "[-0.043686170000000003333, 0.042094484000000001456, ... ]" ; "[-0.049242082999999998993, 0.040926795000000001923, ... ]" ) retourneert .90848158767415143622 voor een bepaald model.

Voorbeeld 2 

CosineSimilarity ( v1 ; v2 ) retourneert .54682693950088512302 voor een bepaald model wanneer de velden v1 en v2 insluitvectoren bevatten voor respectievelijk de tekst "Claris" en "Claire,".