Costruire agent sull'API
Un agent è un modello che gira in un loop: persegue un obiettivo chiamando strumenti, osservando i risultati e decidendo il passo successivo fino al completamento. Prima di costruirne uno, scegli la cosa più semplice che funziona.
Il test decisionale (non costruire troppo)
- Chiamata singola — un prompt risolve tutto. La maggior parte dei task. La più economica e affidabile.
- Workflow — orchestri nel codice una sequenza fissa di chiamate (flusso di controllo deterministico). Usalo quando i passi sono noti.
- Agent — è il modello a decidere i passi dinamicamente. Usalo solo quando il percorso non può davvero essere codificato a priori.
Ricorri a un agent quando l'adattività è il punto centrale — non perché suona impressionante. Un workflow che controlli tu è più facile da testare e correggere.
Progettare il loop
Un agent personalizzato minimale:
- System prompt: l'obiettivo, i vincoli e gli strumenti disponibili.
- Loop: invia i messaggi → se c'è
tool_use, esegui lo strumento, aggiungitool_result, ripeti → fino a una risposta finale o a una condizione di stop. - Guardrail: un limite massimo di iterazioni, un budget di token/costo e la validazione degli input degli strumenti.
- Gestione del contesto: riassumi/sfoltisci man mano che la cronologia cresce (stessa idea di Gestione del contesto).
Il Claude Agent SDK ti fornisce questo loop — strumenti, permessi, gestione del contesto — già pronto, così non devi costruirtelo a mano.
Rendilo robusto
- Poni limiti a tutto: iterazioni, tempo, costo. Gli agent possono entrare in loop.
- Gestisci i fallimenti degli strumenti con eleganza (restituisci l'errore come risultato).
- Privilegio minimo + human-in-the-loop per le azioni rischiose — vedi Mettere in sicurezza gli agent.
- Valutalo su casi reali prima di fidartene — vedi Valutazioni.