Av Amir Elion

Hur bra ser ut: genomarbetade exempel

Fyra agenter som förtjänade sin plats, lästa genom de fem saker som fick dem att fungera.

Varför den här artikeln finns

Det finns ett enkelt test för om en AI-agent kommer att förtjäna sin plats eller tyst slösa bort ett kvartal: om du kan svara på fem frågor om den. Vad är dess uppdrag. Vilket sammanhang har den. Hur mycket autonomi. Vilka verktyg. Och vem sköter tillsynen. De fem frågorna är linsen i Att leda AI-agenter som medarbetare, och de är linsen i den här artikeln.

Det som följer är fyra agenter som jag har hjälpt ledningsgrupper att sätta i arbete, alla anonymiserade, var och en läst genom samma fem frågor. Ingen av dem är en demo. Var och en förtjänade sin plats därför att de fem sakerna sattes med avsikt, och att betrakta dem genom en och samma lins visar dig hur "bra" faktiskt ser ut i praktiken.

Så här läser du dem

Varje exempel berättas på samma sätt: vad agenten gör, hur de fem elementen sattes, och det enda val som gjorde skillnad. Lägg märke till hur ofta det valet handlar om sammanhang eller tillsyn, inte om modellen.

1. Den flerspråkiga supportagenten

Ett företag med en digital produkt får kundfrågor på många språk, dygnet runt. Agenten besvarar dem.

Dess uppdrag är medvetet smalt: besvara frågor om produkten, på kundens språk, och lämna över allt som faller utanför det. Dess sammanhang är produktens egen dokumentation och hjälpmaterial, så att svaren speglar hur produkten faktiskt fungerar i stället för en allmän gissning. Dess autonomi är avgränsad: den besvarar de frågor den kan besvara väl och eskalerar resten till en människa i stället för att improvisera. Dess verktyg är läsbehörighet till den kunskap den behöver och inget mer. Dess tillsyn är en person som granskar eskaleringarna och stickprovskontrollerar resten, plus inbyggda utvärderingstester som körs och bedömer kvaliteten på resultat och utfall: har kundens fråga verkligen besvarats, och vad är kundens sentiment?

Det som gjorde skillnad var gränsen mellan agenten och en människa. Uppdraget definierades lika mycket av var det slutar som av vad det gör: agenten besvarar det den kan besvara väl och slussar allt annat till en person. Dra den gränsen medvetet, så är agenten en genuin tillgång. Lämna den vag i jakten på en avledningssiffra, så är de frågor som betyder mest just de som den kommer att svara fel på.

2. Fakturatriage-agenten

En stor organisation tar emot en stor mängd inkommande fakturor. Agenten hanterar de flesta av dem och eskalerar resten.

Dess uppdrag är att triagera och hantera de rutinmässiga fakturorna och att flagga allt ovanligt för en människa. Dess sammanhang är organisationens egna regler för hur en giltig faktura ser ut, inklusive de undantag som normalt bara finns i huvudet på ekonomiteamet. Dess autonomi är anpassad till återkallbarhet: den hanterar de rena, rutinmässiga fallen och stannar vid allt som är tvetydigt eller högt belopp, vilket går vidare till en person. Dess verktyg är avgränsad behörighet till de ekonomisystem den rör vid, med ett spår av vad den gjorde. Dess tillsyn är ekonomiteamet, som kontrollerar de eskalerade fallen och granskar ett stickprov av resten.

Det som gjorde skillnad var att behandla eskaleringen som själva designen, inte som en eftertanke. Värdet ligger inte i att agenten rör vid varje faktura. Det ligger i att hantera den rutinmässiga majoriteten tillförlitligt och slussa varje undantag till den person som bör se det. Autonomin anpassades till återkallbarhet, och tillsynen levde i undantagen.

3. Regelbevakningsagenten

Ett medicinbolag hanterar sina regulatoriska krav genom ett gemensamt arkiv, där olika intressenter diskuterar och kommer överens om förändringar över tid. Agenten bevakar det arkivet och förutser hur kommande regulatoriska förändringar kommer att påverka produktens färdplan.

Dess uppdrag är att övervaka den regulatoriska diskussionen och lyfta fram konsekvenser tidigt, inte att fatta beslut. Dess sammanhang är det som gör skillnaden: den riktas direkt mot det arkiv där den verkliga diskussionen sker, så att den resonerar utifrån den faktiska källan till sanning i stället för en sammanfattning. Dess autonomi är medvetet låg, eftersom detta är en reglerad domän med höga insatser. Den informerar människor, och människor beslutar. Dess verktyg är läsbehörighet till det arkivet, plus meddelandeverktyg för att nå de relevanta interna intressenterna. Dess tillsyn är produkt- och regelansvariga, som granskar det den flaggar och avgör vad det betyder för färdplanen.

Det som gjorde skillnad var kopplingen och återhållsamheten. Att ansluta agenten till den plats där kraven verkligen debatteras är det som gör dess förutseende användbart. Att hålla den rådgivande, i en domän där ett felaktigt beslut blir ett efterlevnadsproblem, är det som gör den säker. Den är ett framsynsverktyg, inte en beslutsfattare.

4. RFP-svarsagenten

Säljare tar emot inkommande anbudsförfrågningar (RFP), ofta långa och detaljerade. Agenten hjälper dem att svara.

Dess uppdrag är att analysera en inkommande RFP, jämföra den mot företagets produkt- och teamprofiler, och utforma ett svar som ställer varje krav mot en verklig förmåga. Dess sammanhang är det proprietära materialet som gör utkastet bra: produktens faktiska funktioner och teamets faktiska profiler, inte generisk marknadsföring. Dess autonomi är att utforma utkast, aldrig att skicka. Dess verktyg är RFP-dokumenten och de interna produkt- och teamdata. Dess tillsyn är säljaren, som äger det slutgiltiga svaret och relationen bakom det.

Det som gjorde skillnad var att lämna omdömet hos människan. Agenten gör den tunga, tråkiga syntesen av att matcha dussintals krav mot förmågor, vilket är där timmarna försvinner och misstagen smyger sig in. Säljaren behåller den del som kräver omdöme: vad man ska betona, vad man ska lova, och hur man vinner.

Vad dessa fyra har gemensamt

Ingen av dem ersatte en person. Var och en hade ett uppdrag som definierades lika mycket av var det slutar som av vad det gör. I varje fall var det som gjorde skillnaden sammanhang och verktyg, att koppla agenten till verklig, proprietär information, och tillsyn, att ge den en tydlig mänsklig ägare och en verklig eskaleringsväg. Modellen var sällan den intressanta delen. Och tillsammans täcker de de tre platser där agenter skapar värde: att betjäna kunder, att snabba upp internt arbete, och att skärpa kunskapsarbete.

Läst genom de fem frågorna är mönstret tydligt. Dessa agenter förtjänade sin plats därför att någon satte deras uppdrag, deras sammanhang, deras autonomi, deras verktyg och deras tillsyn med avsikt, och fattade det svåraste beslutet, var agenten slutar och en människa tar över, medvetet.

Vad detta förändrar för ledningsgruppen

Bra ser inte ut som en anmärkningsvärd demo. Det ser ut som en agent du kan beskriva i fem svar: ett uppdrag du kan skriva på en sida, sammanhang hämtat från din egen verklighet, autonomi anpassad till insatserna, verktyg den faktiskt behöver, och en namngiven människa som vakar. Om en agent imponerar på dig men du inte kan svara på de fem frågorna om den, så tittar du på ett science fair-projekt, inte ett som fungerar.

Vad du ska göra den här veckan

Ta en agent som du överväger och skriv ner dess fem element på en enda sida innan någon bygger något. Ägna särskild uppmärksamhet åt linjen där den bör eskalera till en människa. I alla fyra exemplen här var den linjen där värdet, och säkerheten, levde.

Vanliga frågor

Är dessa verkliga? Ja. De är verkliga uppdrag, beskrivna i anonymiserad form för att skydda de inblandade organisationerna. Det som betyder något för dig är valen, inte namnen.

Varför eskalerar dessa till människor i stället för att helt automatiseras? Därför att autonomin ska matcha insatserna. Varje agent agerar fritt där handlingar är rutinmässiga och återkallbara, och avstår där ett misstag skulle bli kostsamt eller svårt att göra ogjort. Eskaleringsvägen är själva designen, inte en svaghet i den.

Finns det ett mönster över de fyra? En enda lins passar dem alla: uppdrag, sammanhang, autonomi, verktyg och tillsyn. Där dessa agenter förtjänade sin plats sattes de fem med avsikt, och det som gjorde skillnaden var oftast sammanhang och tillsyn snarare än modellen.

Hur börjar jag med en egen? Använd Varför / Vad / Hur för att välja rätt agent att bygga, och Att leda AI-agenter som medarbetare för att sätta de fem elementen när du väl har valt.