La prompt injection spiegata
Injection diretta e indiretta — istruzioni malevole nascoste nei contenuti che l'IA legge.
Mettere in sicurezza agenti e strumenti
Privilegio minimo, sandboxing, il problema del vicesceriffo confuso e l'human-in-the-loop.
Irrobustire le esecuzioni autonome
Blinda le esecuzioni headless/CI affinché un agente non possa toccare segreti o ambiente di produzione.
Revisione del codice di terze parti
Plugin, skill e server MCP possono distribuire codice eseguibile — revisionali prima di fidarti.
Uso responsabile, etica e verifica
La scala dell'autonomia, la mentalità della verifica, i bias e tenere gli umani nel processo decisionale.