CosineSimilarity

2 つの埋め込みベクトル間の類似度を -1 (反対) と 1 (類似) の間の数で返します。

構文 

CosineSimilarity (v1 ; v2)

引数 

v1 および v2 - 埋め込みベクトルを含む任意のテキスト式、テキストフィールド、またはオブジェクトフィールド。通常、この関数が意味のある値を返すには、2 つの埋め込みベクトルを同じモデルで生成する必要があります。

戻り値のデータタイプ 

数字

起点バージョン 

21.0

説明 

この関数はコサイン法を使用して 2 つの埋め込みベクトル間の類似度を返します。埋め込みベクトルの場合、コサイン類似度は 2 つのテキスト値の類似性を示します。結果は -1 から 1 までの範囲で、1 に近い値はより高い意味的類似性を示し、0 は類似性がないこと、-1 は非類似性を示します。

v1 および v2 がテキストの場合、JSON 配列の形式になっている必要があります。ベクトルも同じ次元を持つ必要があります (配列内の要素が同じ数になっている必要があります)。通常、バイナリオブジェクトデータとして埋め込みベクトルを使用するとパフォーマンスが向上します。

例 1 

CosineSimilarity ("[0.2198736, -0.4397852, ...]" ; "[0.2198736, -0.4397852, ...]") は特定のモデルに対して「.24175542211599998499」を返します。

例 2 

CosineSimilarity (v1 ; v2) は v1 フィールドおよび v2 フィールドにそれぞれテキスト「Claris」および「Claire」の埋め込みベクトルが含まれている場合、特定のモデルに対して「.54682693950088512302」を返します。