CosineSimilarity

Returnerar likheten mellan två inbäddningsvektorer som ett tal mellan -1 (motsatta) och 1 (liknande).

Format 

CosineSimilarity ( v1 ; v2 )

Parametrar 

v1 och v2 – ett textuttryck, textfält eller containerfält som innehåller inbäddningsvektorer. I allmänhet bör de två inbäddningsvektorerna produceras av samma modell för att den här funktionen ska returnera ett meningsfullt värde.

Returnerad datatyp 

nummer

Ursprungsversion 

21.0

Beskrivning 

Den här funktionen returnerar ett mått på likheten mellan två inbäddningsvektorer med hjälp av cosinusmetoden. För inbäddningsvektorer ger cosinuslikhet ett användbart mått på hur liknande två textvärden sannolikt kommer att vara. Resultaten sträcker sig från och med -1 till och med 1, där värden närmare 1 indikerar högre semantisk likhet, 0 indikerar ingen likhet och -1 indikerar olikhet.

Om v1 och v2 är text måste de vara i form av JSON-matriser. Vektorerna måste också ha samma dimensioner (antalet element i matriserna måste vara samma). Vanligtvis förbättras prestanda om man använder inbäddningsvektorer som binära containerdata.

Exempel 1 

CosineSimilarity ( "[0.2198736, -0.4397852, ... ]" ; "[0.2198736, -0.4397852, ... ]" ) returnerar .24175542211599998499 för en viss model.

Exempel 2 

CosineSimilarity ( v1 ; v2 ) returnerar .54682693950088512302 för en viss modell när fälten v1 och v2 innehåller inbäddningsvektorer för texten "Claris" respektive "Claire".