Configurazione delle impostazioni di AI

Le impostazioni consentono di controllare quali componenti del server del modello AI sono abilitati, dove verranno scaricati i modelli, quali modelli sono precaricati e varie impostazioni di affinamento RAG e del modello che migliorano la comunicazione del modello AI.

Per modificare le impostazioni:

Fare clic sulla scheda Servizi di AI > Impostazioni.
Apportare modifiche a una delle seguenti opzioni:
- Servizi: per controllare quali servizi sono forniti dal Server modello.
  - Embedding
  - Generazione - per la generazione di testo
  - RAG
  - Affinamento
    
    Nota Questa opzione è disponibile solo per i sistemi con hardware che supportano i modelli di affinamento.
  - Generazione di didascalie immagini
- Configurazione del server: configura il funzionamento del server modello.
  - Richiedi chiave API per l'accesso
  - Modelli precaricati - carica i modelli specificati nella sezione Modelli precaricati
  - Carica modelli precedenti - carica i modelli precedentemente caricati prima della chiusura del server modello AI
  - Registra utilizzo token
  - Registra prompt e risposte del modello
- Modelli precaricati: controlla quali modelli caricare all'avvio del server modello.
  - Modello di embedding precaricato
  - Modello di generazione di testo precaricato
- Impostazioni RAG: per controllare le opzioni per la retrieval-augmented generation (RAG) sul server modello.
  - Usa la soglia di similarità del coseno per i risultati RAG
  - Soglia di similarità del coseno per i risultati RAG
    
    Nota Questa opzione non viene visualizzata finché non si abilita Usa la soglia di similarità del coseno per i risultati RAG.
  - Numero dei primi risultati per la sintesi RAG
  - Percorso cache RAG
  - Utilizza embedding OpenAI
  - Chiave API OpenAI API per RAG - inserisce una chiave OpenAI API per accedere a una risorsa OpenAI RAG
    
    Nota Questa opzione non viene visualizzata fino a quando non si abilita Modello di embedding OpenAI per RAG.
  - Modello di embedding OpenAI per RAG
  - Dimensione batch per la creazione di embedding RAG
  - Numero di token per blocco di testo - dimensione predefinita di nuovi blocchi di testo quando si aggiunge testo o file a uno spazio RAG; per ridimensionare i blocchi esistenti è necessario eliminare e ricreare lo spazio RAG, quindi aggiungere nuovamente i dati
  - Esegui sincronizzazione RAG - il pulsante ti dà accesso alle impostazioni di sincronizzazione RAG; vedere Esegui sincronizzazione RAG
  Nota Fare clic su Mostra impostazioni avanzate per vedere questa sezione.
- Impostazioni di affinamento: opzioni di controllo per i modelli di affinamento.
  - Prompt di sistema per l'affinamento
  Nota Questa sezione è disponibile solo per i sistemi con hardware che supportano i modelli di affinamento. Abilitare l'opzione Affinamento e fare clic su Mostra impostazioni avanzate per vedere questa sezione.