CosineSimilarity
2 つの埋め込みベクトル間の類似度を -1 (反対) と 1 (類似) の間の数で返します。
構文
CosineSimilarity (v1 ; v2)
引数
v1
および v2
- 埋め込みベクトルを含む任意のテキスト式、テキストフィールド、またはオブジェクトフィールド。通常、この関数が意味のある値を返すには、2 つの埋め込みベクトルを同じモデルで生成する必要があります。
戻り値のデータタイプ
数字
起点バージョン
21.0
説明
この関数はコサイン法を使用して 2 つの埋め込みベクトル間の類似度を返します。埋め込みベクトルの場合、コサイン類似度は 2 つのテキスト値の類似性を示します。結果は -1 から 1 までの範囲で、1 に近い値はより高い意味的類似性を示し、0 は類似性がないこと、-1 は非類似性を示します。
v1 および v2 がテキストの場合、JSON 配列の形式になっている必要があります。ベクトルも同じ次元を持つ必要があります (配列内の要素が同じ数になっている必要があります)。通常、バイナリオブジェクトデータとして埋め込みベクトルを使用するとパフォーマンスが向上します。
例 1
CosineSimilarity ("[0.2198736, -0.4397852, ...]" ; "[0.2198736, -0.4397852, ...]")
は特定のモデルに対して「.24175542211599998499」を返します。
例 2
CosineSimilarity (v1 ; v2)
は v1 フィールドおよび v2 フィールドにそれぞれテキスト「Claris」および「Claire」の埋め込みベクトルが含まれている場合、特定のモデルに対して「.54682693950088512302」を返します。