Salesforce ripensa l'AI aziendale con simulazioni avanzate e nuovi benchmark | BusinessCommunity.it
BusinessCommunity.it

10/09/2025

digital

Salesforce ripensa l'AI aziendale con simulazioni avanzate e nuovi benchmark

Il team di ricerca AI ha svelato strumenti innovativi per potenziare le strategie aziendali e la collaborazione digitale

Il team di esperti di Salesforce AI Research ha recentemente presentato innovazioni significative per accelerare la transizione delle imprese verso modelli sempre più digitali, basati sull'Agentic AI. Queste soluzioni mirano a migliorare la gestione dei dati, la misurazione delle performance e la formazione degli agenti intelligenti, preparando il terreno per prodotti di nuova generazione che supportano i CIO e i responsabili IT nelle sfide attuali. Le innovazioni si concentrano su un ambiente di simulazione per testare l'AI, un nuovo strumento di benchmarking per valutarne le prestazioni e miglioramenti a Data Cloud per l'unificazione automatica dei dati.

Per permettere agli agenti AI di operare efficacemente in contesti aziendali complessi, Salesforce AI Research ha sviluppato CRMArena-Pro. Questo ambiente di simulazione avanzato, basato sul progetto originale CRMArena, consente di addestrare e testare gli agenti in scenari realistici, multi-turno e multi-agente, come la previsione delle vendite, la gestione dei ticket di assistenza e i processi di CPQ (Configure-Price-Quote). Utilizzando dati sintetici e integrandosi in modo sicuro con le API dei sistemi aziendali, CRMArena-Pro permette alle aziende di valutare la precisione, l'efficienza e la continuità degli agenti su larga scala, anche in situazioni critiche come le interruzioni della supply chain o le escalation del servizio clienti. L'obiettivo è formare agenti AI non solo competenti, ma anche coerenti, affidabili e pronti a supportare i processi aziendali.

Comprendere quale modello o combinazione di modelli AI sia più adatta per un'azienda è una sfida crescente. Per questo motivo, Salesforce ha introdotto Agentic Benchmark for CRM, il primo strumento di benchmarking specificamente progettato per valutare gli agenti AI nei contesti più strategici del CRM: servizio clienti, assistenza sul campo, marketing e vendite. Questo benchmark analizza gli agenti secondo cinque metriche chiave: accuratezza, costo, velocità, affidabilità/sicurezza e sostenibilità. In particolare, la sostenibilità misura l'impatto ambientale dei sistemi AI, promuovendo l'allineamento delle dimensioni del modello con l'intelligenza necessaria per un compito specifico, riducendo così l'impronta ecologica senza compromettere le prestazioni.

A completamento della suite di valutazione, sono stati introdotti MCP-Eval e MCP-Universe. Questi benchmark complementari sono progettati per valutare gli agenti con diversi livelli di approfondimento, monitorando le interazioni dei modelli linguistici con i server MCP (Model Context Protocol) in scenari d'uso reali. MCP-Eval offre una valutazione automatica e scalabile tramite task sintetici, ideale per test su un'ampia gamma di server MCP; mentre MCP-Universe introduce compiti complessi con valutazioni basate sull'esecuzione, mettendo gli agenti alla prova in scenari difficili e offrendo un framework estendibile. Questo approccio integrato è cruciale, poiché la ricerca ha evidenziato limiti nei modelli linguistici attuali, come difficoltà nella gestione di contesti lunghi o con strumenti sconosciuti, che ne frenano l'adozione su vasta scala.


Le prestazioni affidabili degli agenti AI dipendono fortemente da dati unificati e di alta qualità, essenziali per decisioni accurate e conformi alle policy aziendali. Tuttavia, molte aziende affrontano il problema di dati frammentati e incoerenti, con duplicazioni e campi incompleti. Per risolvere questa sfida, i team di ricerca e prodotto di Salesforce AI hanno potenziato la funzionalità Account Matching. Utilizzando modelli linguistici avanzati, Account Matching identifica e unifica automaticamente gli account presenti in set di dati disomogenei. Ad esempio, "The Example Company, Inc." e "Example Co." vengono riconosciute come un'unica entità e consolidate in un record autorevole. A differenza dei sistemi statici basati su regole, questa soluzione riconcilia milioni di dati in tempo reale, garantendo significativi miglioramenti nell'accuratezza e fornendo dati puliti e unificati per alimentare gli agenti AI, abilitando così un'automazione più intelligente e decisioni rapide e scalabili.


BusinessCommunity.it - Supplemento a G.C. e t. - Reg. Trib. Milano n. 431 del 19/7/97
Dir. Responsabile Gigi Beltrame - Dir. Editoriale Claudio Gandolfo


Copertina BusinessCommunity.it