Kunst & kultur
Foto: Ritzau/Scanpix. Illustration: Ruth-Anne Degn Dausell

Denne tekst er skrevet af et menneske …

… men sådan behøver det ikke at være fremover. Automatiseret tekstfremstilling sniger sig mere og mere ind i alt fra dagligdagens små tekster til unik poesi. På godt og ondt. Det giver nye muligheder, men hvem taler egentlig?

Kunst & kultur
Foto: Ritzau/Scanpix. Illustration: Ruth-Anne Degn Dausell

De teknologiske forandringer kommer stærkt for tiden: Vores musik og film fylder ikke længere på reolerne, men er røget op i skyen, vores smartphones har adgang til al slags information, kontanter er på vej ud, og skærme, som engang havde synlige pixels, er nu skarpere, end hvad vores øjne kan opfatte. Men disse ændringer vedrører alt sammen ydre forhold, som gør forbrug og kommunikation lettere, men ikke fundamentalt anderledes.

Hvis der virkelig finder en egentlig teknologisk revolution sted lige nu, finder vi den i fremmarchen af automatiseret sprogbrug. I årtusinder har vi læsende væsner kunnet regne med, at en tekst var skrevet af andre mennesker ligesom os selv. Oftest med en signatur, der viste, hvem der stod på mål for teksten, også selvom der havde været bistand fra redaktører, men grundlæggende var tekster skrevet af mennesker.

Sådan er det ikke nødvendigvis længere. Med maskinlæring og kunstig intelligens er der sket store fremskridt i kvaliteten af forskellige former for automatiseret sprogprocessering, som bliver anvendt i stigende grad.

Mange mennesker har sikkert haft en forestilling om, at det at skrive ville være en af de sidste aktiviteter, som maskiner ville blive gode til, i det mindste så gode, at de overgår menneskets evner. Men den forestilling bristede dog for skakspillere for lang tid siden, da IBM’s computer Deep Blue slog den russiske verdensmester Gary Kasparov i 1997, efter at Kasparov havde vundet det første opgør i 1996.

I dag er det derfor forbudt at have mobiltelefoner med til skakturnering, da de har rigeligt med regnekraft til at hjælpe med at udmanøvrere elitespillere, måske endda selveste norske Magnus Carlsen. Men i modsætning til sproget, så er der meget faste regler og mål i skak, som gør det lettere at få en maskine til at blive god til at flytte brikker.

Vi er på vej ind i en verden, hvor tekster i stigende omfang skabes i samarbejde med maskiner eller helt og aldeles af maskiner.

Skeptikere over for maskinernes fremmarch har måske fundet trøst i, at godt nok kan en telefon forstå tale og give mere eller mindre gode svar, eller at en chatrobot kan være indgangen til et forsikringsselskab, men indtil nu har kun de færreste af os troet, endsige forventet, at disse automatiserede systemer kan frembringe et brugbart eller kreativt produkt af blivende værdi.

Men niveauet for kvaliteten i automatiseret tekstproduktion løfter sig mærkbart for tiden, og vi er på vej ind i en verden, hvor tekster i stigende omfang skabes i samarbejde med maskiner eller helt og aldeles af maskiner.

Jeg vil her give tre eksempler på, hvordan automatiseret skrivning har betydning nu og her, med forbehold for, at der kan være langt mere indgribende opfindelser på vej: Automatiserede oversættelser, skriveassistenter og tekstgenerationsprogrammer er alle fænomener, der kan være med til at give os et andet forhold til tekst.

Ikke flere vitser om maskinoversættelse

Tidligere kunne vi med rette lave grin med, hvordan oversættelsesprogrammer kunne gå helt galt i byen, men hvis en spøgefugl tyer til den slags morsomheder i dag, så er det tegn på, at han eller hun ikke har rigtigt fulgt med i den teknologiske udvikling.

En vits fra firserne om, hvordan en computer oversatte det engelske ordsprog ’Out of sight, out of mind’ til russisk og tilbage til engelsk med resultatet ’The invisible idiot’, er sådan set stadig sjov, men har ikke så meget med tingenes tilstand i dag at gøre.

Der skete et markant skifte for fem år siden, da Google Translate skiftede fra groft sagt en ordbogsmodel til en maskinlæringsmodel i dette meget udbredte værktøj. I stedet for at gå frem ord for ord så er Google Translate blevet trænet på et meget stort korpus af oversættelser af alt fra enkelte sætninger til hele websider og bøger til og fra engelsk, japansk og swahili. Den understøtter nu mere end 100 sprog.

Google Translate har skabt sit eget neurale netværk med regler, som ikke er gennemskuelige for en menneskelig betragter, men som leverer meget fine resultater. Denne tilgang har forøget maskinens evne til at forstå, hvordan teksten hænger sammen som helhed betragteligt.

Den noget mere ukendte tyskudviklede oversætter DeepL blev lanceret i 2017 og slår oftest Google i kvaliteten af oversættelser. Den er bestemt heller ikke ufejlbarlig, men den skaber tekster, der både er ganske korrekte og læselige uden de mange klodsede fejl, som var udbredte for bare fem-seks år siden. De fejl, som maskinerne stadig laver, må så rettes i en korrektur, og der er således stadig en opgave til det menneskelige blik.

Der er åbenlyse fordele ved, at oversættelserne er kommet op på et højere niveau. Automatisk oversættelse giver enorme muligheder for at kunne læse tekster, som ellers ville være uden for ens sproglige rækkevidde, og de demokratiserer muligheden for at skrive på andre sprog. Ikke mindst åbner det for at formulere sig mere nuanceret på sprog, som man ikke behersker fuldt ud.

Hvorfor skal vi mennesker dog gide at lære noget som helst, hvis maskinen serverer det hele for os?

Bagsiden kunne være, at denne teknologiske landvinding opmuntrer til dovenskab: Hvorfor skal vi mennesker dog gide at lære noget som helst, hvis maskinen serverer det hele for os? Det er en pædagogisk udfordring, som dog må tage højde for, at oversættelsesteknologi er kommet for at blive, og det er næppe nok at appellere til, at tilegnelsen af et nyt sprog tilbyder mere end at få tilføjet et instrument til vores udtryksmuligheder, men også udvider verden.

DeepL’s oversættelse af åbningen på F. Scott Fitzgeralds The Great Gatsby til dansk.

Den dynamiske grammatikvejleder

En ting er oversættelser, noget andet er, hvordan vi selv skriver. Vi har længe været vant til de røde understregninger, som Microsoft Word laver, og som jo i stigende grad har fjernet banale stavefejl fra det skrevne sprog. Men der er en yderligere indgriben på vej.

En af de mest populære skriveassistenter, Grammarly, nøjes ikke blot med at rette grammatiske fejl i vores tekster, men vi kan også indstille den til at rådgive om, hvordan vi rammer et ønsket stilleje og sværhedsgrad. Om det skal være uformelt eller formelt? Om det skal være nøgternt eller skrives i en optimistisk tone, der forsøger at overtale?

Skal teksten være akademisk eller til et bredt publikum? Grammarly står klar med råd med en ofte forbløffende præcision, når den for eksempel foreslår, at man forenkler en lang sætning og selv kommer med et forslag til hvordan.

Igen er der en åbenlys fordel ved at bruge et værktøj, der kan minimere antallet af fejl i en tekst, ikke mindst hvis brugeren ikke har engelsk som modersmål, som indtil videre er det eneste sprog, som Grammarly tilbyder sin service for. Men ens tekster kommer også med en underlig fornemmelse af, at man ikke er herre i eget sproglige hus som før.

De røde streger i Word tager jo ikke noget væk fra min selvstændige tanke, men retter blot banale stavefejl. Fornemmelsen af ført pen er anderledes, når Grammarly forslår en helt anden syntaks, uanset om man bare kan ignorere dem. Vi kan tænke på Grammarly som en velmenende redaktør eller korrekturlæser, men det gør psykologisk en forskel, at rådene kommer fra et system, som vi ikke har indsigt i.

Den skrivende computer

Endelig kan computere også trænes til at kunne skrive selv. Nonprofit-selskabet OpenAI har fået mest opmærksomhed med deres Generative Pre-trained Transformer, der nu er nået til version tre, GPT-3.

Her har OpenAI trænet systemet på et umådeligt stort datamateriale hentet fra internettet, fra bøger og fra hele Wikipedia. Wikipedia-delen udgør ca. 3 %, hvilket antyder omfanget. GPT-3 er på baggrund af dens ”træning” i stand til at skrive videre på det tekstinput, som den får, gennem et ufatteligt sæt af parametre, der forsøger at forudsige, hvad det bedste næste ord må være.

Den engelske avis The Guardian trykte den 8. september 2020 en artikel skrevet af GPT-3, som havde fået til opgave at skrive et essay om, at robotterne kommer med fred. Teksten blev ikke færdig i første hug, for GPT-3 spytter også underlige formuleringer og konklusioner ud.

The Guardian fik derfor GPT-3 til at lave otte forskellige tekster, men den menneskelige redaktør hævder, at hver af dem kunne have været trykt i avisen, og at han og hans kollegaer valgte at plukke de bedste passager fra samtlige otte tekster og skrive dem sammen til ny tekst.

Det menneskelige blik for sammenhæng og relevans er altså stadig svært at slå.

Det menneskelige blik for sammenhæng og relevans er altså stadig svært at slå. Men når det er sagt, så er det nærmest ærefrygtindgydende at overvære, hvad GPT-3 er i stand til, når man er logget ind på systemet og ser spritny tekst komme frem i browseren. Ikke mindst evnen til at ramme sprogtonen er imponerende.

Min egen fascination opstår først og fremmest, når GPT-3 skriver, hvad man kun kan opfatte som en original videreførelse af en tekst. Det er svært ikke at tænke på denne teknologi som en selvstændig kreativ kraft, Nogle gange når dens tekster et niveau, hvor den skaber et produkt, som ikke blot er interessant i øjeblikket, men – med den overbærenhed, som vi typisk udviser over for en så ny teknologi – faktisk tænker tanker, som man ikke selv havde tænkt.

Sådan ser det ud, når GPT-3 skriver videre på åbningen af The Great Gatsby.

GPT-3 kan dog langtfra alt. Den virker bedst, når den ikke skal lave for lange tekster. Hvis en bruger i stedet indstiller GPT-3 til at producere en tekst længere end en kvart eller halv side, så bliver han eller hun nok mindre imponeret, efterhånden som teksten skrider frem.

Men som del af et menneske-maskine-samarbejde er der bestemt muligheder for at kunne spille pingpong med GPT-3 og lade den bygge videre på ens egne tanker. Igen med risikoen for, at man føler sig lidt mindre som et autonomt subjekt, hvis denne utrættelige tekstmaskine kommer med bedre ideer end en selv.

Samtidig skal man også være klar over, at kunstig intelligens ikke er fordomsfrit, og GPT-3 har, som Torben Sangild beskrev det i Zetland, også evnen til at skrive tekster, der er etisk problematiske og eksempelvis racistiske. For den er ikke bedre end de tekster, som den er trænet på.

Så meget afhænger af GPT-3 og en rød trillebør

Jeg har haft mulighed for at prøve GPT-3 i nogle måneder, og jeg har både været fascineret af dens reaktion på eksempelvis en tekst om paradokser, som jeg selv havde skrevet, og input til andre tekster, som jeg ikke selv havde tænkt over. Mest forundret blev jeg, da jeg fodrede GPT-3 med første halvdel af mit yndlingsdigt, ”The Red Wheelbarrow”, af den amerikanske forfatter William Carlos Williams. Det korte digt fra 1923 begynder:

                      so much depends

                      upon

                      a red wheel

                      barrow

GPT-3 kunne færdiggøre digtet, da den formentlig er blevet trænet på den. Dog uden opsætningen med brudte ord, som jeg har tilføjet her, men GPT-3 havde ramt Williams’ ord korrekt:

                      glazed with rain

                      water

                      beside the white

                      chickens

Men jeg stirrede for alvor ind i skærmen med åben mund, da jeg læste dens bud på, hvad der kunne følge:

So much depends upon a woman quietly dying of cancer in a white hospital room while the rain falls on the roof.

Williams var læge, og flere af hans digte og fortællinger trækker på erfaringer herfra, men at se digtet blive genfortolket på denne måde var ret grænseoverskridende. Hvad har maskinen læst af Williams? Hvordan får den form og indhold til at gå op i denne højere enhed? Det ved man ikke helt, og som sagt, så laver den også skæverter, der ikke giver så meget mening som her.

Men i det enorme datasæt, som den er trænet på, må GPT-3 have opfanget et mønster af referencer til Williams’ lægegerning, som han også lod komme til syne i sin digtning. GPT-3 må have regnet sig frem til, at det er sandsynligt, at noget, der afhænger af noget andet, kunne være relateret til sygdom, som en læge som Williams behandler.

GPT-3 har ingen ånd, naturligvis, men den forekommer temmelig åndrig til tider.

GPT-3 har ingen ånd, naturligvis, men den forekommer temmelig åndrig til tider. Kan man med sikkerhed sige, at det er en maskine og ikke et menneske, der har skrevet de tekster, der kommer ud af GPT-3? Ofte ikke, og det nærmer sig, at den har bestået en form for Turing-test, hvor vi ikke kan skelne mellem den ene eller den anden afsender.

Navnet på testen stammer fra den engelske matematiker Alan Turing, som i 1950 foreslog, at en maskine udviser intelligens på et menneskeligt niveau, hvis det ikke er muligt at afgøre, om man kommunikerer med en maskine eller et menneske.

Fagre nye verden

I den sidste ende er automatiseret skrift kun værdifuld for os mennesker, hvis den gør vores verden bedre. En god oversættelse, bedre sprogbrug og en kreativ kraft til at skabe nye tekster kan vi nok alle sammen se en fordel i. For eksempel vil vi kunne få skrevet individualiserede fortællinger, hvor et menneske sætter præmisserne, men får et resultat, der både overrasker og holder sig inden for de rammer, som brugeren har defineret.

Måske vil GPT-3 og dens efterfølgere aldrig nogensinde producere stilistiske mesterværker på niveau med kanoniserede forfattere som engelske Virginia Woolf eller franske Marcel Proust, men deres fortællinger vil have andre kvaliteter. Det kunne være muligheden for at få lavet en personaliseret litteratur.

Vi kan betragte denne mulighed som en slags videreudvikling af den såkaldte fanfiktion, hvor fans af Harry Potter- eller Fifty Shades-bøgerne skriver videre på de originale værker, men selv sætter rammerne for, hvad der skal ske i deres egne tilføjelser. Disse forfatterspirer kan med hjælp fra teknologien endda udvikle helt nye værker og blot bestemme, hvad personerne skal hedde, og så ellers ikke løfte en finger, men lade deres skriveassistent om det hårde arbejde.

I alle tilfælde skal vi vænne os til en verden, hvor spørgsmålet om autenticitet og ophav bliver mere usikkert. Jeg kan dog forsikre alle, der læser denne tekst, at den er skrevet af et menneske.

Læs mere om den fagre ny verden af automatiseret tekst

  • Torben Sangild i Zetland om GPT-3

BIOGRAFIER

Professor, Aarhus Universitet
Professor i litteraturhistorie ved Aarhus Universitet. Han har forsket i verdenslitteratur, litteraturhistorieskrivning og det posthumane. I de senere år har han arbejdet med digitaliseringens metodiske udfordringer til litteraturvidenskaben.

ANBEFALET TIL DIG

Menu