Vitomir Jovanović: Koji su dometi veštačke inteligencije?

Šta bi neka suverena zemlja mogla da učini po pitanju razvoja veštačke inteligencije? Ključan aspekt bi bio izbor adekvatnih podataka, odnosno digitalnog jezičkog korpusa koji bi reprezentovao kulturu i istoriju te zemlje, i koji bi čitaoci mogli da koriste

Od kada je 30. novembra 2022. OpenAI objavio generativni model GPT-3 koji je istreniran na velikom korpusu pre svega javnih licenciranih podataka i dostupnih resursa na internetu (prvenstveno iz Wikipedia-e), ushićenje i zabrinutost oko korišćenja veštačke inteligencije su dosta splasli, pre svega što su korisnici, nakon prvog oduševljenja, počeli da uviđaju ograničenja i nedostatke modela. Tu su takozvane “halucinacije” i slabost u matematičkom rezonovanju prve došle do izražaja.

Međutim, ono što je naročito zanimljivo jeste kako se ova, u tom trenutku komparativna prednost Zapada, koristila u političkom diskursu, naročito do pojave kineskog pandana DeepSeek koji ima niz komparativnih prednosti u odnosu na modele OpenAI. Jedna od prvih “iscurelih” vesti jeste razgovor inžinjera Gugla Blejka Lemuana koji je tvrdio da je veštačka inteligencija razvila svest. Tada je to uznemirilo javnost ali svakome ko je zaista znao kako radi veštačka inteligencija ove tvrdnje su izgledale apsurdno. Činjenica da je zbog ovoga Lemuan dobio otkaz činilo je strah još opravdanijim.

Drugi pravac u isticanju veštačke inteligencije jeste da je ona “nepristrasni alat” koji može pomagati u transparentnosti u upravljanju političkim procesima i koji će dovesti do neke vrste blagostanja, a onda po drugim shvatanjima, takođe preteranim, do mračne, autoritarne distopije u kojoj će ljudi biti kontrolisani od strane VI. Tokom razgovora na različitim onlajn grupama često se kao argument pojavljivalo „šta na to kaže veštačka inteligencija“, jer je tobož “nepristrasna i objektivna”, iako ona ne može da zameni ekspertsko znanje.

VI zavisi od vrste tekstova, odnosno dominantnog naučnog i enciklopedijskog diskursa kojim se obučavanje jezičkog modela vrši. Koliko je to daleko otišlo govori činjenica da je Edi Rama početkom septembra predstavio AI ministarku (četbota Deilu) kako bi unapredio transparentnost i smanjio korupciju što je naišlo na burne reakcije od strane opozicionih poslanika u parlamentu koji su u ovome videli “propagandne fantazije”.

Edi Rama je izjavio da je Deila u međuvremenu “zatrudnela i da će roditi 83 VI asistenta za svakog poslanika socijalističke partije” kako bi im pomagala ali kako bi ih i nadzirala (ovde). Sve ovo otvara potrebu da svako od nas kao građanin bude bolje upoznat sa tim kako zapravo funkcioniše VI (prventstveno četbotovi) kako bi se sprečile potencijalne zloupotrebe i manipulacije.

Način rada

Jezički modeli koje koristi ChatGPT (firma OpenAI) i DeepSeek (pored njih tu su Gemini, Fejsbukovi modeli, Klaud, itd.) razvijeni su kao posebna podoblast mašinskog učenja, u okviru obrade prirodnog jezika (Natural Language Processing – NLP). Samo mašinsko učenje dugo se koristi u različitim oblastima ljudskog delovanja, a u suštini predstavlja algoritamski način da se dođe do aproksimacije funkcije koja najbolje opisuje vezu između ulaznih i izlaznih podataka.

Prilikom uzimanja kredita u banci, matematički model na osnovu istorijskih podataka o prethodnim korisnicima (ulazni podaci o npr. nivou obrazovanja, dužini radnog staža, visini primanja) i njihovoj uspešnosti u vraćanju kredita (izlazni podaci u vidu da li jeste ili nije vratio kredit) – izbacuje verovatnoću da svaki novi korisnik sa njegovim osobinama uspešno vrati kredit.

Reči predstavljene kao vektori (nizovi brojeva)

Revolucija u NLP-u bila je mogućnost da se svaka reč izrazi uz pomoć niza brojeva (tzv. ugnježdenih vektora), tako što su kreirani različiti modeli koji su predviđali da se dve reči nalaze jedna pored druge u nekom jezičkom korpusu, odnosno, modeli su predviđali određenu reč na osnovu konteksta (okolnih reči) ili su predviđali kontekstualne reči na osnovu centralne reči.

Parametri ovih neuralnih mreža činili su zapravo vektore za svaku reč. Tokom treninga koji zahteva izuzetno jake računare, model podešava težine u vektorskom prostoru tako da reči koje se često pojavljuju u sličnim kontekstima dobijaju slične vektore. Tako je svaka reč predstavljena pomoću niza brojeva.

Ovo je dovelo do fenomenalnog uvida da operacije na vektorima ovih reči dovode do značenjskog smisla reči, pa ako od vektora reči “kralj” oduzmemo vektor “muškarac” i dodamo vektor “žena” dobićemo vektor koji je najsličniji vektoru “kraljica” („kralj“ – „muškarac“ + „žena“ ≈ „kraljica“). Na taj način je pokazano da vektori u nekom višedimenzionalnom prostoru predstavljaju prenos značenja višeg reda (našeg smisaonog, ljudskog znanja) na ograničeni dimenzionalni sistem mašine, sistem nižeg reda koji imitira ljudsko znanje. Takođe mašina postaje sposobna da razume kontekst onoga što joj se šalje zahvaljujući mehanizmima samopažnje kod ulaznog prompta (upita).

Kodiranje, ilustracija (Foto: Pixabay/Pexels)

Ovi vektori su dalje korišćeni za razvoj jezičkih modela koji smo svi počeli da koristimo. Ulazni upit (prompt, ono što kucamo u npr. ChatGPT ili DeepSeek) se pretvara u vektor i on ulazi u veliku neuralnu mrežu od više milijardi neurona (svaki neuron treba shvatiti kao malu funkciju koja prima neku brojčanu vrednost i izbacuje neku brojčanu vrednost) gde se treniranje sastojalo u tome da model adekvatno prepozna sledeću reč u korpusu tekstova koji mu je dat za trening.

Tako su zapravo jezički modeli samo automati koji su istrenirani da izbacuju sledeću najverovatniju reč na osnovu tekstova na kojima su trenirani. Kada model izbaci najverovatniju reč, onda se cela ta nova fraza sa prethodno predviđenom reči vraća u model i model onda izbacuje sledeću najverovatniju reč, imajući u vidu prethodne dve. To se dešava do neke granice koja je određena za dužinu odgovora.

Čak je za naprednije korisnike moguće podešavati “temperaturu” modela, odnosno da li će model vraćati uvek najverovatniju reč (što je poželjno kod konvergentnih zadataka sa samo jednim rešenjem) ili će možda imati veći raspon od verovatnih reči od kojih će nasumično vraćati neku od njih čime tekst postaje “kreativniji”, “nekonvencionalniji”.

Halucinacije koje bi se javile pri najmanjoj temperaturi (najkonvergentnijem tekstu koji uvek vraća najverovatniju reč) zapravo nisu nekakve greške modela ili nešto što se sporadično dešava, već su posledica samog načina na koji je model istreniran i možda ograničenja da za neke retke reči model nije imao dovoljno adekvatnog jezičkog korpusa.

Ali tu postoji jedan važan sloj koji se često ne spominje, a to je da svi odgovori koji jezički model pruža, bivaju poslati specijalno zaposlenima, tzv. “anotarima” koji te odgovore označavaju na određenoj skali kao poželjne ili nepoželjne tako da se model od strane neposredne ljudske intervencije “podešava” ka onome što data firma koja obučava dati model smatra poželjnim ili nepoželjnim prilikom samog treninga (ova komponenta se naziva učenje potkrepljivanjem).

Naravno, tu su uvek uključene sve protivzakonite radnje kao nepoželjne i sve ono što može činiti štetu drugom ljudskom biću ali je pitanje da li se i određene istorijske i političke teme isto tako manje ili više favorizuju. Pored toga što zavisi od samog korpusa tekstova na kojima se trenira i koji sami po sebi mogu biti pristrasni, jezički model zavisi dodatno od instrukcija koje anotatori imaju, tako da se ne može reći da je veštačka inteligencija u potpunosti nezavisna i objektivna prema naučnim ili common sense kriterijumima (ovde).

Političko-ideloški sloj

Kao što smo videli, pojam singularnosti i plašenje njime, u smislu da se veštačka inteligencija može otrgnuti kontroli nakon što pređe određenu tačku u kojoj će nadmašiti čoveka u sposobnostima i postati autonoman sistem koji će gledati svoje interese – nije osnovan. Ali ako joj date izvod nekog teksta koji ste pisali i tražite joj da nastavi taj tekst, ona će biti sposobna da to izvede imitirajući stil teksta koji je videla, što može ličiti da neku vrstu inteligencije, premda će taj tekst suštinski biti neupotrebljiv i moraće biti prerađen od strane čoveka.

Strah od singularnosti je doveo toga da se društvenim mrežama širio klip kako su se roboti u Kini samoaktivirali i postali nasilni tim intenzitetom da su se u uticajnim medijima našli zvanični demanti kako se radi o lažnoj vesti (v. ovde). Tako čak neki autori (npr. Botstrom) smatraju da najveća pretnja čovečanstvu nije nuklearni rat ili klimatske promene, već nekontrolisana veštačka inteligencija koja će dospeti do superinteligencije (singularnosti).

Sama singularnost deluje kao fikcija za nešto što je u principu jezički automat i možda samo kao traženje publiciteta kod još nedovoljno poznate oblasti. Ipak, jezički automat uspeva da prema količini znanja koje poseduje i načinom na koji produkuje iskaze, u mnogo čemu nadmaši u nekim stvarima čak i eksperte.

Pametni telefon, ilustracija (Foto: rmartinr on Pixabay)

Mnogo opravdaniji razlog za strah jeste činjenica da adekvatne računare za treniranje modela imaju samo tri kompanije (Amazon, Google, Microsoft). Njih imaju i druge kompanije, ali ove tri kompanije su razvile platforme koje iznajmljuju računare i tako stiču supremaciju i glavnu dobit od razvoja VI. Kada to povežemo sa podatkom koji govori koliko je sam trening modela skup, ta nejednakost postaje izraženija i privilegija za treniranjem velikih jezičkih modela jeste ograničena na mali broj kompanija.

Kineski DeepSeek je pokušao da utiče na ovo iz razloga jer ni sam nije imao pristup tako jakim mašinama. Kompanija je privukla globalnu pažnju svojim modelima kao što su DeepSeek V3 i DeepSeek-R1, koji su se istakli po performansama i efikasnosti u odnosu na skuplje i zatvorene sisteme kao što su GPT-4 i Gemini. Takođe, DeepSeek je poznat po tome što je razvio svoje modele uz značajno nižu cenu treninga, oko 294.000 dolara za R1 model, što je daleko manje u poređenju sa stotinama miliona dolara koje su potrošili konkurenti. To je uradio kroz inovacije na planu algoritama.

I treće, na pojedinačnom nivou, VI je turbina za ekspertski mozak koga može još ubrzati, jer zavisi od kvaliteta postavljenog pitanja, što može napraviti samo dodatnu razliku između postignuća onih sa manje ili više obrazovanja.

Dalji razvoj VI

Šta bi neka suverena zemlja mogla da učini po pitanju razvoja VI? Pod uslovom da postoje uslovi za ulaganje u računare velike snage, ključan aspekt bi bio izbor adekvatnih podataka, odnosno digitalnog jezičkog korpusa koji bi reprezentovao kulturu te zemlje i istoriju i koji bi čitaoci mogli da koriste.

Takođe, moguće je razviti lokalne sisteme sa ovim već istreniranim modelima a koji će moći da koriste poverljive podatke bez toga da podaci idu na tuđe servere. Uz automatizaciju procesa treniranja, VI će se pre razvijati ka reprezentaciji određenog specifičnog znanja, odnosno određenog kulturnog i jezičkog korpusa, nego što će se razvijati po dubini.

„Chat GPT“, četbot zasnovan na veštačkoj inteligenciji (Foto: Emiliano Vittoriosi on Unslpash)

Već sada postoje specijalizovani modeli koji su istrenirani samo na naučnim tekstovima i predstavljaju alat koji naučnik može koristiti za simboličnu mesečnu nadoknadu a koji mogu neverovatno ubrzati proces pretrage i citiranja naučnih članaka. Isto tako možemo zamisliti modele koji su istrenirani na korpusu srpske Vikipedije i drugih digitalizovanih sadržaja na srpskom jeziku koji mogu značajno unaprediti pretrage, sumiranja i zaključivanja iz različitih tekstova.

Više nije pitanje da li hoćemo ili nećemo da je koristimo, već da li znamo da je upotrebimo za ono u čemu može da nam pomogne. Kao što više nije pitanje da li neko hoće ili neće da koristi internet, tako više nije pitanje da li hoćemo da živimo sa ili bez VI, već kako da ona zauzme baš ono mesto koje joj pripada. Isto tako je važno da svaki građanin zna kako ona zapravo radi kako ne bi bio podložan tendencijama da se njome manipuliše u različite svrhe.

Način rada

Političko-ideloški sloj

Dalji razvoj VI

Kompas pravih vrednosti