OpenAI, tvrac ChatGPT-a, razvija novi projekt kodnog naziva "Strawberry" (Jagoda), prema internoj dokumentaciji i izvoru upoznatom s tim pitanjem, koje prenosi agencija Reuters. Riječ je o inicijati iz OpenAI-ja koja ima za cilj prikazati napredne mogućnosti razmišljanja u njihovim modelima umjetne inteligencije.
Interni dokumenti otkrivaju da timovi u OpenAI-ju rade na Strawberryju najmanje od svibnja. Međutim, Reuters nije mogao potvrditi točan vremenski okvir, niti koliko je blizu projekt javnoj objavi. Izvor je opisao projekt kao rad u tijeku i držao ga se povjerljivim čak i unutar tvrtke.
Cilj Strawberryja
Strawberry ima za cilj omogućiti OpenAI-jevoj umjetnoj inteligenciji da izvrši "duboka istraživanja", autonomno navigirajući internetom radi generiranja odgovora i planiranja unaprijed. Tu sposobnost za modele umjetne inteligencije dosad je bilo teško postići, prema intervjuima s više od desetak istraživača umjetne inteligencije.
Želimo da naši modeli umjetne inteligencije vide i razumiju svijet više kao mi. Kontinuirano istraživanje novih mogućnosti umjetne inteligencije uobičajena je praksa u industriji, uz zajedničko uvjerenje da će se ovi sustavi s vremenom poboljšati u rasuđivanju, rekao je glasnogovornik OpenAI-ja. Na konkretne upite Reutersa o Strawberryju, iz OpenAI-ja nisu dali odgovore.
Ključ u naknadnoj obuci
Prethodno poznat kao Q*, Strawberry se prošle godine smatrao novim probojem unutar tvrtke. Ranije ove godine, dva su izvora svjedočila Q* demonstracijama koje bi mogle odgovoriti na složena prirodoslovna i matematička pitanja izvan dosega trenutnih modela. Nedavno je na internom sastanku OpenAI demonstrirao istraživački projekt s vještinama rasuđivanja sličnim ljudskim. Reuters ipak nije mogao potvrditi je li bila riječ o Strawberryju.
Strawberry koristi specijalizirani proces takozvane "naknadne obuke" za poboljšanje izvedbe AI modela nakon početne obuke na velikim skupovima podataka. To uključuje tehnike poput "finog podešavanja", gdje se ljudska povratna informacija i primjeri dobrih i loših odgovora koriste za poboljšanje modela.
Poboljšanje AI rasuđivanja ključno
Navedeni pristup je sličan Stanfordovom modelu "Self-Taught Reasoner" (STaR), koji iterativno stvara vlastite podatke o obuci za postizanje viših razina inteligencije. "Mislim da je to i uzbudljivo i zastrašujuće...ako stvari nastave u tom smjeru, kao ljudi moramo razmisliti o nekim ozbiljnim stvarima", rekao je Noah Goodman, profesor sa Stanforda koji je pomogao u razvoju STaR-a.
Strawberry cilja na složene zadatke koji zahtijevaju dugoročno planiranje, poznate kao zadaci dugog horizonta (LHT). OpenAI obučava modele na skupu podataka "dubokog istraživanja" kako bi to postigao. Tvrtka također ima za cilj koristiti Strawberry za autonomno pregledavanje weba i pomoć u inženjerskim zadacima softvera i strojnog učenja.
Poboljšanje AI rasuđivanja ključno je za postizanje ljudske ili nadljudske inteligencije, omogućujući aplikacije u stvarnom svijetu poput znanstvenih otkrića i naprednog razvoja softvera. Izvršni direktor OpenAI-ja Sam Altman naglasio je ranije ove godine da će najvažnija područja napretka (umjetne inteligencije) biti oko sposobnosti zaključivanja.
Drugi tehnološki divovi poput Googlea, Mete i Microsofta također istražuju načine poboljšanja AI rasuđivanja, iako se mišljenja razlikuju o sposobnosti velikih jezičnih modela (LLM) da uključe dugoročno planiranje. Yann LeCun iz Mete izrazio je skepticizam u pogledu postizanja LLM-a na način razmišljanja poput ljudskog. Unatoč tome, OpenAI vidi Strawberry kao ključnu ulogu u prevladavanju trenutnih ograničenja umjetne inteligencije i napredovanju prema sofisticiranijim sustavima umjetne inteligencije.