CosineSimilarity

Retourneert de gelijkenis tussen twee insluitvectoren als een getal tussen -1 (tegenovergesteld) en 1 (vergelijkbaar).

Opmaak 

CosineSimilarity ( v1 ; v2 )

Parameters 

v1 en v2 - een tekstexpressie, tekstveld of containerveld dat insluitvectoren bevat. Over het algemeen moeten de twee insluitvectoren door hetzelfde model worden geproduceerd om deze functie een betekenisvolle waarde te geven.

Resulterend gegevenstype 

getal

Afkomstig uit versie 

21.0

Beschrijving 

Deze functie retourneert een maat voor de gelijkenis tussen twee insluitvectoren met behulp van de cosinusmethode. Voor insluitvectoren geeft cosinusgelijkenis een nuttige maatstaf voor hoe vergelijkbaar twee tekstwaarden waarschijnlijk zijn. De resultaten variƫren van -1 t/m 1, waarbij waarden dichter bij 1 voor een hogere semantische gelijkenis, 0 voor geen gelijkenis en -1 voor verschillen staan.

Als v1 en v2 tekst zijn, moeten ze de vorm hebben van JSON arrays. De vectoren moeten ook dezelfde afmetingen hebben (het aantal elementen in de arrays moet hetzelfde zijn). Meestal echter verbetert het gebruik van insluitvectoren als binaire containergegevens de prestaties.

Voorbeeld 1 

CosineSimilarity ( "[0.2198736, -0.4397852, ... ]" ; "[0.2198736, -0.4397852, ... ]" ) retourneert .24175542211599998499 voor een bepaald model.

Voorbeeld 2 

CosineSimilarity ( v1 ; v2 ) retourneert .54682693950088512302 voor een bepaald model wanneer de velden v1 en v2 insluitvectoren bevatten voor respectievelijk de tekst "Claris" en "Claire,".