Configurazione delle impostazioni di AI

Le impostazioni consentono di controllare quali componenti del server del modello AI sono abilitati, dove verranno scaricati i modelli, quali modelli sono precaricati e varie impostazioni di affinamento RAG e del modello che migliorano la comunicazione del modello AI.

Per modificare le impostazioni:

  1. Fare clic sulla scheda Servizi di AI > Impostazioni.

  2. Apportare modifiche a una delle seguenti opzioni:

    • Servizi: per controllare quali servizi sono forniti dal Server modello.

      • Embedding

      • Generazione - per la generazione di testo

      • RAG

      • Affinamento

        Nota  Questa opzione è disponibile solo per i sistemi con hardware che supportano i modelli di affinamento.

      • Generazione di didascalie immagini

    • Configurazione del server: configura il funzionamento del server modello.

      • Richiedi chiave API per l'accesso

      • Modelli precaricati - carica i modelli specificati nella sezione Modelli precaricati

      • Carica modelli precedenti - carica i modelli precedentemente caricati prima della chiusura del server modello AI

      • Registra utilizzo token

      • Registra prompt e risposte del modello

    • Modelli precaricati: controlla quali modelli caricare all'avvio del server modello.

      • Modello di embedding precaricato

      • Modello di generazione di testo precaricato

    • Impostazioni RAG: per controllare le opzioni per la retrieval-augmented generation (RAG) sul server modello.

      • Usa la soglia di similarità del coseno per i risultati RAG

      • Soglia di similarità del coseno per i risultati RAG

        Nota  Questa opzione non viene visualizzata finché non si abilita Usa la soglia di similarità del coseno per i risultati RAG.

      • Numero dei primi risultati per la sintesi RAG

      • Percorso cache RAG

      • Utilizza embedding OpenAI

      • Chiave API OpenAI API per RAG - inserisce una chiave OpenAI API per accedere a una risorsa OpenAI RAG

        Nota  Questa opzione non viene visualizzata fino a quando non si abilita Modello di embedding OpenAI per RAG.

      • Modello di embedding OpenAI per RAG

      • Dimensione batch per la creazione di embedding RAG

      • Numero di token per blocco di testo - dimensione predefinita di nuovi blocchi di testo quando si aggiunge testo o file a uno spazio RAG; per ridimensionare i blocchi esistenti è necessario eliminare e ricreare lo spazio RAG, quindi aggiungere nuovamente i dati

      • Esegui sincronizzazione RAG - il pulsante ti dà accesso alle impostazioni di sincronizzazione RAG; vedere Esegui sincronizzazione RAG

      Nota  Fare clic su Mostra impostazioni avanzate per vedere questa sezione.

    • Impostazioni di affinamento: opzioni di controllo per i modelli di affinamento.

      • Prompt di sistema per l'affinamento

      Nota  Questa sezione è disponibile solo per i sistemi con hardware che supportano i modelli di affinamento. Abilitare l'opzione Affinamento e fare clic su Mostra impostazioni avanzate per vedere questa sezione.