Configurazione delle impostazioni di AI
Le impostazioni consentono di controllare quali componenti del server del modello AI sono abilitati, dove verranno scaricati i modelli, quali modelli sono precaricati e varie impostazioni di affinamento RAG e del modello che migliorano la comunicazione del modello AI.
Per modificare le impostazioni:
-
Fare clic sulla scheda Servizi di AI > Impostazioni.
-
Apportare modifiche a una delle seguenti opzioni:
-
Servizi: per controllare quali servizi sono forniti dal Server modello.
-
Embedding
-
Generazione - per la generazione di testo
-
RAG
-
Affinamento
Nota Questa opzione è disponibile solo per i sistemi con hardware che supportano i modelli di affinamento.
-
Generazione di didascalie immagini
-
-
Configurazione del server: configura il funzionamento del server modello.
-
Richiedi chiave API per l'accesso
-
Modelli precaricati - carica i modelli specificati nella sezione Modelli precaricati
-
Carica modelli precedenti - carica i modelli precedentemente caricati prima della chiusura del server modello AI
-
Registra utilizzo token
-
Registra prompt e risposte del modello
-
-
Modelli precaricati: controlla quali modelli caricare all'avvio del server modello.
-
Modello di embedding precaricato
-
Modello di generazione di testo precaricato
-
-
Impostazioni RAG: per controllare le opzioni per la retrieval-augmented generation (RAG) sul server modello.
-
Usa la soglia di similarità del coseno per i risultati RAG
-
Soglia di similarità del coseno per i risultati RAG
Nota Questa opzione non viene visualizzata finché non si abilita Usa la soglia di similarità del coseno per i risultati RAG.
-
Numero dei primi risultati per la sintesi RAG
-
Percorso cache RAG
-
Utilizza embedding OpenAI
-
Chiave API OpenAI API per RAG - inserisce una chiave OpenAI API per accedere a una risorsa OpenAI RAG
Nota Questa opzione non viene visualizzata fino a quando non si abilita Modello di embedding OpenAI per RAG.
-
Modello di embedding OpenAI per RAG
-
Dimensione batch per la creazione di embedding RAG
-
Numero di token per blocco di testo - dimensione predefinita di nuovi blocchi di testo quando si aggiunge testo o file a uno spazio RAG; per ridimensionare i blocchi esistenti è necessario eliminare e ricreare lo spazio RAG, quindi aggiungere nuovamente i dati
-
Esegui sincronizzazione RAG - il pulsante ti dà accesso alle impostazioni di sincronizzazione RAG; vedere Esegui sincronizzazione RAG
Nota Fare clic su Mostra impostazioni avanzate per vedere questa sezione.
-
-
Impostazioni di affinamento: opzioni di controllo per i modelli di affinamento.
-
Prompt di sistema per l'affinamento
Nota Questa sezione è disponibile solo per i sistemi con hardware che supportano i modelli di affinamento. Abilitare l'opzione Affinamento e fare clic su Mostra impostazioni avanzate per vedere questa sezione.
-
-