Costruire agent sull'API

Avanzato

Un agent è un modello che gira in un loop: persegue un obiettivo chiamando strumenti, osservando i risultati e decidendo il passo successivo fino al completamento. Prima di costruirne uno, scegli la cosa più semplice che funziona.

Il test decisionale (non costruire troppo)

Chiamata singola — un prompt risolve tutto. La maggior parte dei task. La più economica e affidabile.
Workflow — orchestri nel codice una sequenza fissa di chiamate (flusso di controllo deterministico). Usalo quando i passi sono noti.
Agent — è il modello a decidere i passi dinamicamente. Usalo solo quando il percorso non può davvero essere codificato a priori.

Ricorri a un agent quando l'adattività è il punto centrale — non perché suona impressionante. Un workflow che controlli tu è più facile da testare e correggere.

Progettare il loop

Un agent personalizzato minimale:

System prompt: l'obiettivo, i vincoli e gli strumenti disponibili.
Loop: invia i messaggi → se c'è tool_use, esegui lo strumento, aggiungi tool_result, ripeti → fino a una risposta finale o a una condizione di stop.
Guardrail: un limite massimo di iterazioni, un budget di token/costo e la validazione degli input degli strumenti.
Gestione del contesto: riassumi/sfoltisci man mano che la cronologia cresce (stessa idea di Gestione del contesto).

Il Claude Agent SDK ti fornisce questo loop — strumenti, permessi, gestione del contesto — già pronto, così non devi costruirtelo a mano.

Rendilo robusto

Poni limiti a tutto: iterazioni, tempo, costo. Gli agent possono entrare in loop.
Gestisci i fallimenti degli strumenti con eleganza (restituisci l'errore come risultato).
Privilegio minimo + human-in-the-loop per le azioni rischiose — vedi Mettere in sicurezza gli agent.
Valutalo su casi reali prima di fidartene — vedi Valutazioni.

Il test decisionale (non costruire troppo)​

Progettare il loop​

Rendilo robusto​

Avanti​

Il test decisionale (non costruire troppo)

Progettare il loop

Rendilo robusto

Avanti