CosineSimilarity
2 つの埋め込みベクトル間の類似度を -1 (反対) と 1 (類似) の間の数で返します。
構文
CosineSimilarity (v1 ; v2)
引数
v1
および v2
- 埋め込みベクトルを含む任意のテキスト式、テキストフィールド、またはオブジェクトフィールド。
戻り値のデータタイプ
数字
起点バージョン
21.0
説明
この関数はコサイン法を使用して 2 つの埋め込みベクトル間の類似度を返します。埋め込みベクトルの場合、コサイン類似度は 2 つのテキスト値の類似性を示します。結果は -1 から 1 までの範囲で、1 に近い値はより高い意味的類似性を示し、0 は類似性がないこと、-1 は非類似性を示します。
v1 および v2 がテキストの場合、JSON 配列の形式になっている必要があります。ベクトルも同じ次元を持つ必要があります (配列内の要素が同じ数になっている必要があります)。通常、バイナリオブジェクトデータとして埋め込みベクトルを使用するとパフォーマンスが向上します。
メモ
-
正規化された埋め込みベクトルが必要です。互換性とパフォーマンスを確保するために、すべての埋め込みベクトルは同じモデルから生成する必要があります。異なるモデルからの埋め込みベクトルの混在はサポートされていません。
例 1
CosineSimilarity ( "[-0.043686170000000003333, 0.042094484000000001456, ... ]" ; "[-0.049242082999999998993, 0.040926795000000001923, ... ]" )
は特定のモデルに対して「.90848158767415143622」を返します。
例 2
CosineSimilarity (v1 ; v2)
は v1 フィールドおよび v2 フィールドにそれぞれテキスト「Claris」および「Claire」の埋め込みベクトルが含まれている場合、特定のモデルに対して「.54682693950088512302」を返します。