Inom loppet av en vecka efter lanseringen den 30 november var det AI-drivna samtalsverktyget Chat GPT det hetaste samtalsämnet. Tidiga användare fascinerades av samtalsförmågan, till och med kreativiteten, i verktyget. Entusiasterna basunerade ut att nu behövs det inte människor längre för att skriva marknadsföringstexter, annonser, essäer, rapporter eller i princip vad som helst utom möjligen de mest specialiserade vetenskapliga rapporterna. Samtidigt kommer AI att kunna hantera alla våra kundtjänstsamtal, bokningar och andra rutinmässiga samtal.

Men ta det lite lugnt nu. Mina egna experiment med den underliggande tekniken tyder på att det fortfarande är en bit kvar innan vi når dit.

En sak som skiljer Chat GPT från tidigare AI-underbarn är att det inte bara är tech- och affärsmedia som bryr sig den här gången: Vanliga människor gör det också.

En lärarvän frågade mig bara en vecka efter Chat GPT:s debut om hur lärare ska kunna upptäcka elever som använder AI för att skriva sina arbeten. Att avslöja klipp-och-klistra-jobb från Wikipedia och nätet är svårt nog, men ett AI-verktyg som skriver ”originaluppsatser” skulle göra studentuppsatser och rapporter meningslösa som bedömningsverktyg för deras lärande.

(Om man byter till muntliga presentationer med en frågestund skulle problemet fixa sig, eftersom eleverna då skulle behöva visa live och utan hjälp vad de faktiskt förstår. Men givetvis ger skolorna inte lärarna tillräckligt med tid för en så lång examination.)

Vad är Chat GPT – och GPT-3?

Chat GPT är den senaste satsningen från Open AI Foundation (ett forskningsföretag som stöds av Microsoft, Linkedingrundaren Reid Hoffman och investeringsbolaget Khosla Ventures) för att skapa naturliga språksystem som inte bara kan komma åt information utan faktiskt sammanställa, framställa och skriva den på samma sätt som en människa skulle göra. Det använder Open AIs Generative Pretrained Transformer 3 (GPT-3)-databas och motor, som innehåller miljontals artiklar som motorn har analyserat så den kan ”förstå” relationerna mellan begrepp och deras uttryck, samt betydelserna av dessa begrepp, i naturlig språklig text. Open AI har sagt att GPT-3 kan bearbeta naturliga språkmodeller med 175 miljarder parametrar – bara föreställ er det!

GPT-3 är inte nytt, men Open AI öppnar alltmer för utomstående användare för att hjälpa GPT-3 att självträna genom att ”observera” hur tekniken används och – lika viktigt – hur den rättas av människor. GPT-3 är heller inte det enda verktyget på området, även om det får mycket uppmärksamhet. Microsoft har sitt Deepspeed och Google sitt Switch Transformer, som båda kan bearbeta en biljon eller fler parametrar (vilket närmast får GPT-3 att verka primitivt i jämförelse).

Som vi har sett med flera AI-system har GPT-3 en del kritiska svagheter som ofta glöms bort i euforin över vad de första GPT-baserade tjänsterna genomför – samma svagheter som är vanliga i mänskligt skrivande men med färre filter och självcensur: rasism, sexism, andra stötande fördomar, och även lögner, dolda motiv och fake news. Det kan alltså generera toxiskt innehåll. Teamet på Open AI förstår den här risken fullt ut: 2019 stängde de av offentlig åtkomst till föregångaren GPT-2-systemet för att förhindra skadlig användning.

Men visst är det fantastiskt att läsa vad GPT-3 kan skapa. På ett plan känns texten mycket mänsklig och skulle lätt passera Turingtestet, vilket innebär att en person inte skulle kunna avgöra om den är skriven av en maskin eller människa. Men du behöver inte gräva särskilt djupt för att inse att verktygets imponerande förmåga att skriva naturliga meningar inte automatiskt innebär att det faktiskt förstår vad det pratar om.

Hands-on med GPT-3: Gräv inte för djupt

Tidigare i år ägnade jag en del tid åt Copysmiths AI-verktyg, en av flera innehållsgeneratorer som använder GPT-3. Mitt mål var att se om verktyget skulle kunna komplettera de mänskliga skribenterna på vårt moderföretag Foundry, genom att hjälpa till att skriva inlägg på sociala medier, komma med möjliga artikelvinklar för juniora reportrar och kanske till och med sammanfatta grundläggande pressmeddelanden och samtidigt avhajpa dem, på samma sätt som det finns innehållsgeneratorer för att skriva basala artiklar om börskurser och sportresultat.

Även om Copysmith-chefer berättade för mig att verktygets innehåll är tänkt att fungera som förslag – en utgångspunkt för mindre skickliga skribenter att utforska ämnen och formuleringar – är marknadsföringen tydligt inriktad på personer som producerar webbsidor, för att skapa tillräckligt trovärdiga texter för att de ska bli indexerade av Googles sökmotor och öka oddsen för att de ska dyka upp i sökresultaten, samt att skriva så många varianter som möjligt av sociala marknadsföringstexter för användning på den stora arenan av sociala nätverk.

Open AI begränsar tredjeparter som Copysmith till att bara kunna arbeta med textsnuttar, vilket naturligtvis minskar belastningen på Open AI:s GPT-3-motor men också begränsar ansträngningen som krävs av den motorn. (De AI-baserade innehållsgeneratorerna är vanligtvis begränsade till initiala koncept skrivna med 1 000 tecken eller mindre.)

Men även det ganska enkla målet avslöjade varför GPT-3 ännu inte är ett hot mot professionella skribenter utan bara kan användas i vissa grundläggande fall. Som så ofta när det gäller fantastiska tekniker, är framtiden både längre bort och närmare än det verkar – det beror bara på vilken specifik aspekt man väljer att titta på.

Det GPT-3 lyckades bra med i mina tester av Copysmith AI var att skriva om små bitar av text, som att ta titeln och första stycket av en artikel för att skapa flera utdrag som kunde användas i sociala kampanjer eller marknadsföringsbilder. Om den källtexten är tydlig och inte innehåller språkliga återkopplingar (som flera ”men” i rad), så skapade Copysmith AI oftast användbar text. Ibland var sammanfattningarna för täta, vilket gjorde det svårt att analysera flera attribut i ett stycke, eller överförenklade, vilket tog bort viktiga nyanser eller underkomponenter.

Ju mer specialiserade termer och begrepp i originaltexten, desto mindre ansträngde sig Copysmith AI för att vara kreativ i sin presentation. Även om det beror på att verktyget inte hade tillräckligt med alternativ relaterad text att använda för omformulering, var slutresultatet att systemet var mindre benäget att ändra innebörden.

Men mindre benäget är inte samma sak som oförmögen. I några få fall missförstod den innebörden av termer och skapade därför felaktig text. Ett exempel: ”stöd på seniornivå kan kräva extra kostnad” blev ”ledande befattningshavare kräver högre löner” – vilket förvisso kan vara sant men det var inte vad texten betydde eller ens handlade om.

Felslut som detta pekar på att GPT-3 lyckades dåligt med att skapa innehåll baserat på en fråga eller koncept, jämfört med att bara försöka skriva om eller sammanfatta. Den förstår inte avsikt (mål), flöde eller ursprung. Som ett resultat får du Potemkinkulisser, byar som ser trevliga ut från ett passerande tåg, men som inte tål en närmare granskning.

Som ett exempel på att inte förstå avsikter, föreslog Copysmith AI användning av Chromebooks när den blev ombedd att generera ett artikelförslag om att köpa Windows-datorer. Det gav många skäl att välja Chromebooks istället för pc-datorer men ignorerade källtextens fokus på pc. När jag körde samma fråga igen fick jag ett helt annat förslag och ett avsnitt om alternativ till pc. (Det verkar som att Copywriter.AI inte vill att läsare ska köpa Windows-datorer.) I en tredje körning av samma fråga bestämde den sig för att fokusera på problemen med småföretagens leveranskedjor som inte alls hade någon koppling till den ursprungliga frågans ämne.

Verktyget gjorde samma kontextkapning i andra tester också. Utan att förstå vad jag försökte få fram (en köpguide till Windows-datorer, som jag tyckte var tydligt med då jag använde den frasen i min fråga), letade GPT-3 (via Copysmith AI) bara efter begrepp som korrelerar eller i alla fall relaterar på något sätt till datorer och föreslog dem.

Det naturliga skrivflödet – berättande, med ett tema och en röd tråd – saknades också. När jag använde ett Copysmith AI-verktyg för att generera innehåll baserat på dess förslag, var varje segment för sig till stor del meningsfullt. Men sammansatta blev de ganska slumpmässiga. Det fanns inget flöde, ingen tråd som följdes.

Om du skriver ett stycke eller två för en e-handelssida om till exempel fördelarna med ägg eller hur man tar hand om gjutjärn så lär inte det här vara ett stort problem. Men för min lärarvän som är orolig för att en AI ska skriva elevernas uppsatser åt dem, misstänker jag att avsaknaden av en verklig historia kommer att vara påtaglig – vilket innebär att lärare kommer att kunna upptäcka AI-genererade studentuppsatser, även om det kräver mer ansträngning än att upptäcka det gamla vanliga klipp-och-klistra-jobbet från olika webbplatser. Avsaknad av citat kommer att vara ett annat sådant tecken.

Proveniens är ursprung: Vem skrev källmaterialet som den genererade texten är baserad på (så att du kan bedöma trovärdighet, expertis och eventuell partiskhet), var befinner de sig och var arbetar de (för att veta vilka de är knutna till och i vilken region de verkar, och för att förstå potentiell partiskhet och tankesätt), och när skrev de det (för att veta om det kan vara inaktuellt). Open AI exponerar inte det här ursprunget för tredje part som Copysmith, så den resulterande texten kan inte litas på bortom välkända fakta. Tillräckligt mycket av texten i mina tester innehöll ledtrådar om tvivelaktiga källor i en eller flera av dessa aspekter så att jag kunde se att den genererade texten var ett mishmash som inte skulle tåla verklig granskning.

Till exempel var undersökningsdata helt oredovisade, men där jag kunde hitta originalen via webbsökningar såg jag snabbt att de kunde skilja sig åt med flera år eller handla om olika (även om det var något relaterade) ämnen och undersökningspopulationer. Att välja och vraka bland fakta för att skapa en berättelse man vill ha är ett gammalt trick av despoter, fake news-leverantörer och andra manipulatörer. Det är inte vad AI borde göra.

Åtminstone bör den GPT-genererade texten länka till sina källor så att man kan se att komponenterna är meningsfulla, pålitliga och lämpligt relaterade, och inte bara skrivna på ett vettigt sätt. Open AI har hittills valt att inte avslöja vad deras databas innehåller för att generera innehållet som tillhandahålls i verktyg som Chat GPT och Copysmith AI.

Slutsats: Om du använder GPT-baserade innehållsgeneratorer behöver du professionella skribenter och redaktörer för att åtminstone validera resultaten, och sannolikt göra det stora arbetet, medan AI-verktygen fungerar som ytterligare input.

AI är framtiden, men den framtiden är fortfarande under utveckling

Jag menar inte att kritisera Copysmith AI – det är bara en frontend till GPT-3, precis som Chat GPT och många andra verktyg för naturligt språk. Och jag menar inte att kritisera GPT-3 – trots stark proof of concept är det fortfarande till stor del i betaläge och kommer att utvecklas under flera år. Och jag menar inte ens att kritisera AI – trots decennier av överhajp är verkligheten den att AI fortsätter att utvecklas och tekniken hittar hela tiden användbara roller i allt fler system och processer.

I många fall, som Chat GPT, är AI fortfarande ett cirkustrick som kommer att fängsla oss tills nästa trick kommer. I vissa fall är det en användbar teknik som kan komplettera både mänskliga och maskiners aktiviteter genom snabb analys av enorma mängder data för att föreslå en känd reaktion.

På en grundläggande nivå är AI mönstermatchning och korrelation som görs med otroliga hastigheter och som möjliggör snabba reaktioner – snabbare än vad människor kan göra i vissa fall, som att upptäcka cyberattacker eller förbättra många företagsprocesser.

AI handlar inte bara om kunskap eller information, även om ju mer information den framgångsrikt kan korrelera och bedöma, desto bättre kan AI fungera. AI är inte heller intelligent som människor, katter, hundar, bläckfiskar och många andra varelser i vår värld. Visdom, intuition, uppfattningsförmåga, omdöme, fantasi och högre syfte saknas i AI, och det kommer att krävas mycket mer än en biljon parametrar för att få sådana förmågor.

Njut av Chat GPT och dess gelikar. Lär dig allt om dem så att du kan använda dem i dina företagstekniska satsningar. Men tro inte för ett ögonblick att det mänskliga sinnet har ersatts.