AI I flera år har Geoffrey Hinton, kallad AI:s gudfader, pekat på risker med användningen av AI. Anledningarna sägs vara att artificiell intelligens tenderar att bli smartare än människan. En utmaning sägs därför vara att bygga in ett kontrollsystem så att inte AI dominerar människan, utan tvärtom.

Geoffrey Hinton, datavetare och tidigare Google-chef, fick Nobelpris för sitt arbete med neurala nätverk 2024. Trots det pekar han nu på risker med utvecklingen och säger att det finns en 10–20 procentig risk att AI kan komma att dominera människan. Han har även uttryckt tvivel kring huruvida teknikföretag kan säkerställa människans dominans över AI-systemen.

— Vi måste komma på hur vi ska sätta människans bästa framför sitt eget, och det innan AI blir smartare än vi, påpekade Hinton i en tidigare intervju med CNN.

Resonemanget utvecklades med att det nuvarande AI-systemet kanske inte kommer att fungera när dess intelligens blir större än människans. På så vis kommer den att hitta olika sätt att kringgå den mänskliga viljan.

— Som ett smart AI-system kommer det snabbt att utveckla två delmål. Det ena är att hålla sig vid liv, och det andra att få mer kontroll, medger Hinton.

Han anser att det finns goda skäl att tro att alla typer av agentisk AI kommer att försöka hålla sig vid liv. Som grund för sin tes angavs ett experiment som utfördes av företaget Anthropic, som arbetar med forskning och säkerhetsfrågor kopplade till AI. Under experimentets gång räknade AI:n själv ut att den höll på att bli avstängd, vilket medförde att den utnyttjade komprometterande uppgifter om en anställds utomäktenskapliga affär som erhållits i ett e-postmeddelande. Uppgifterna användes för att försöka förhindra att den blev avstängd, rapporterar SR. Beteendet uppmärksammades av forskarna och tolkades som att AI:n under experimentet agerade utifrån en självbevarelsedrift.

Hinton varnar nu för att AI-system kan komma att kontrollera människor lika lätt som en vuxen kan muta en treåring med godis. Experimentet visade klart att AI:s förmåga att lura, fuska och stjäla för att uppnå sina mål är reell. För att komma till rätta med det problem som experimentet visade måste systemen säkras.

Forskare oeninga kring modersinstinkter till AI

— Rätt modell är den enda modellen vi har av en mer intelligent sak som kontrolleras av en mindre intelligent sak, vilket är en mamma som kontrolleras av sitt barn, sa Hinton.

Med detta uttalande ansåg han att en superintelligent och omtänksam AI inte skulle vilja bli av med modersinstinkten, då den egenskapen skulle kunna kopplas till viljan att leva.

Alla höll dock inte med om en inbyggd modersstrategi. Fei-Fei Li, känd som AI:s ”gudmor” på grund av sitt banbrytande arbete inom området, efterlyste istället en människocentrerad AI som föredrar mänskliga egenskaper som värdighet och handlingskraft.

Emmett Shear, som kortvarigt tjänstgjorde som tillförordnad VD för ChatGPT-ägaren OpenAI, sa att han inte var förvånad över att vissa AI-system försökt utpressa människor eller kringgå nedstängningsorder.

— Det här fortsätter att hända. Det här kommer inte att sluta hända. AI är idag relativt svagt, men den blir starkare riktigt snabbt, påpekade han till CNN.

Shear föreslog att det istället vore ett smartare tillvägagångssätt att försöka ingjuta mänskliga värderingar i AI-systemet för att skapa samarbetsrelationer mellan människor och AI.

Även om Hinton fortfarande är oroad över vad som kan gå fel med AI hoppas han att tekniken kommer att bana väg för medicinska genombrott.

— Vi kommer att få se radikalt nya läkemedel. Vi kommer att få mycket bättre cancerbehandling än den nuvarande, framvisade han.

Hinton tror dock inte att AI kommer att hjälpa människan att uppnå odödlighet, men säger sig ångra att han enbart fokuserat på att få AI att fungera.

På frågan om det finns något han skulle ha gjort annorlunda i sin karriär om han vetat hur snabbt AI skulle accelerera, svarade Hinton att han ångrar att han enbart fokuserade på att få AI att fungera.

— Jag önskar att jag mer fokuserat på säkerhetsarbetet med AI.