AI 設定の構成

設定では AI モデルサーバーコンポーネントの有効化、モデルのダウンロード場所、事前ロードされたモデル、および AI モデル通信を強化するさまざまな RAG およびモデルのファインチューニング設定を制御できます。

設定を変更するには:

[AI サービス] > [設定] タブをクリックします。
次のオプションのいずれかを変更します:
- サービス: モデルサーバーによって提供されるサービスを制御します。
  - 埋め込み
  - 生成 - テキスト生成用
  - RAG
  - ファインチューニング
    
    メモこのオプションはファインチューニングモデルをサポートするハードウェアを使用したシステムでのみ利用できます。
  - イメージキャプション生成
- サーバー構成: モデルサーバーの動作方法を構成します。
  - アクセスには API キーが必要
  - モデルを事前ロード - [事前にロードするモデル] セクションで指定されたモデルをロードします。
  - 以前のモデルをロード - 以前にロードしたモデルをロードしてから AI モデルサーバーをシャットダウンします。
  - トークン使用量を記録
  - モデルのプロンプトと応答を記録
- 事前にロードするモデル: モデルサーバーの起動時にロードするモデルを制御します。
  - 事前にロードする埋め込みモデル
  - 事前にロードするテキスト生成モデル
- RAG 設定: モデルサーバー上の検索拡張生成 (RAG) のオプションを制御します。
  - RAG 結果のコサイン類似度しきい値を使用
  - RAG 結果のコサイン類似度しきい値
    
    メモこのオプションは [RAG 結果のコサイン類似度しきい値を使用] を有効にすると表示されます。
  - RAG 集計の上位の結果の数
  - RAG キャッシュのパス
  - OpenAI 埋め込みを使用
  - RAG の OpenAI API キー - OpenAI API キーを入力して OpenAI RAG リソースにアクセスします。
    
    メモこのオプションは [RAG の OpenAI 埋め込みモデル] を有効にすると表示されます。
  - RAG の OpenAI 埋め込みモデル
  - RAG 埋め込み作成のバッチサイズ
  - テキストチャンクあたりのトークン数 - テキストやファイルを RAG スペースに追加する際の新しいテキストチャンクのデフォルトサイズです。既存のチャンクのサイズを変更するには、RAG スペースを削除して再作成してから、再度データを追加する必要があります。
  - RAG 同期を実行 - このボタンで RAG 同期設定が開きます。RAG 同期の実行を参照してください。
  メモこのセクションを表示するには [詳細設定を表示] をクリックする必要があります。
- ファインチューニング設定: ファインチューニングモデルのオプションを制御します。
  - ファインチューニングのシステムプロンプト
  メモこのセクションはファインチューニングモデルをサポートするハードウェアを使用したシステムでのみ利用できます。このセクションを表示するには [ファインチューニング] オプションを有効にして [詳細設定を表示] をクリックする必要があります。