Kako bi umjetna inteligencija bila što uspješnija, odnosno kako bi njeni rezultati bili točni i korisni, ona mora biti trenirana na velikoj količini podataka i sadržaja. No pri treniranju nije bitna samo kvantiteta, već naravno i - kvaliteta. Nakon godina treniranja, sve je manja količina dostupnih podataka koje su stvorili ljudi, a povećava se količina koju je stvorila umjetna inteligencija. Sve je veći broj članaka na internetu, kao i slika pa čak i glazbe i videa koje potpisuje ova tehnologija.
Kako se ta količina AI sadržaja bude povećala tako će se i umjetna inteligencija trenirati na sadržaju koji je sama stvorila. Takva bi situacija, naglašava se u posljednjem znanstvenom radu, mogla dovesti do kolapsa AI sustava koji bi mogli postati besmisleni. Umjetna inteligencija tako bi mogla reciklirati postojeće tekstove koje je već napisala sama AI, a istraživanje pokazuje kako je potrebno samo nekoliko ciklusa stvaranja sadržaja i onda treniranja tehnologije na takvim podacima, da AI počne producirati sadržaj koji nema niti smisla, niti neke vrijednosti. Znanstvenici su dali primjer jednog sustava koji je treniran na tekstu o srednjovjekovnoj arhitekturi te je trebalo samo devet generacija da sadržaj koji je napisala AI postane samo bezvrijedna hrpa ponavljajućih gluposti.
Takva je situacija u skladu s tzv. teorijom mrtvog interneta prema kojoj je sve više sadržaja na mreži automatizirano i vrti se u krug pa je njihova kvaliteta sve manja. Pri treniranju AI, postoji mogućnost da se neki podaci koji nisu toliko učestali izostave, a kako se onda tehnologija ponovno trenira na takvim novim podacima u kojima su te informacije izostavljene, u njenim odgovorima neće biti raznovrsnosti, niti će biti spomenuti važni događaji ili stvari koje možda nisu toliko učestali.
Umjesto da nam pomogne, takva umjetna inteligencija na kraju će nam davati netočne i nepotpune odgovore, a kako se njeno treniranje nastavi, konačni rezultat mogao bi biti potpuni raspad sustava i besmisleni odgovori.
Trenutačno su u prednosti kompanije koje su među prvima krenule u treniranje podataka s interneta jer tada nije bilo još toliko automatiziranog sadržaja i podataka s potpisom umjetne inteligencije te su njihovi modeli precizniji, no i to se mijenja jer se AI mora konstantno trenirati na novim podacima. U studiji, koja je objavljena u Natureu, naglašava se kako se ovom problemu treba pristupiti ozbiljno ako i dalje želimo zadržati benefite treniranja AI na velikoj količini podataka s interneta.
Izvor: The Independent