Kineski istraživači, uz podršku hedž fonda sa sjedištem u Hangdžou, nedavno su objavili novu verziju modela veštačke inteligencije pod nazivom Dipsik-R1 (DeepSeek-R1), koji ima sposobnosti kao i najrazvijeniji takvi američki proizvodi, ali navodno to čini sa manje računarskih resursa i uz mnogo niže troškove.
Haj Flajer (High Flyer), hedž fond koji podržava Dipsik, saopštio je da model gotovo odgovara performansama programa koje su napravile američke firme kao što su OpenAI, Gugl i Meta, ali to radi koristeći samo oko 2.000 kompjuterskih čipova starije generacije. Čipove proizvodi Nvidia, lider u industriji sa sjedištem u SAD, uz cijenu od oko samo 6 miliona dolara za obuku sistema.
Poređenja radi, Metin AI sistem, Lama (Llama), koristi oko 16.000 čipova i navodno košta Metu znatno više novca za obuku.
Model otvorenog koda (open-source)
Očigledni napredak u kapacitetima kineske vještačke inteligencije dolazi nakon godina napora američke vlade da ograniči pristup Kine naprednim čipovima i opremi koja se koristi za njihovu proizvodnju. U protekle dvije godine, pod predsjednikom Džoom Bajdenom, SAD su uvele više mjera kontrole izvoza sa specifičnim ciljem usporavanja napretka Kine u razvoju vještačke inteligencije.
Čini se da je Dipsik inovacijama trasirao svoj put do neke vrste uspjeha, razvijajući nove i efikasnije algoritme koji omogućavaju čipovima u sistemu da efikasnije komuniciraju jedni sa drugima, čime se poboljšavaju performanse sistema.
Dio onoga što su programeri Dipsika učinili da mu poboljšaju performanse vidljiv je posmatračima izvan kompanije, jer je model otvorenog koda, što znači da su algoritmi koje koristi za odgovaranje na pitanja javni.
Reakcija tržišta
Vijest o sposobnostima Dipsika izazvala je veliku rasprodaju tehnoloških dionica na američkim tržištima u ponedjeljak, jer su investitori počeli da se pitaju da li će planovi američkih kompanija da ulože stotine milijardi dolara u centre za vještačku inteligenciju i drugu takvu infrastrukturu očuvati njihovu dominacija na terenu. Kada su se tržišta zatvorila u ponedjeljak, Nasdak indeks koji obuhvata većinu tehnoloških firmi, izgubio je 3,1% svoje vrednosti, a cijena dionica Nvidije su pale za skoro 17 procenata.
Međutim, ne vjeruju svi stručnjaci za vještačku inteligenciju da je reakcija tržišta na izlazak Dipsik opravdana, ili da tvrdnje o razvoju tog modela treba uzeti zdravo za gotovo.
Mel Moris, izvršni direktor kompanije "Corpora.ai" iz Velike Britanije, rekao je za Glas Amerike da vjeruje da je reakcija tržišta bila pretjerana, iako je Dipsik impresivna tehnologija. Dodao je da je potrebno više informacija da bi se precizno procijenio uticaj koji će Dipsik imati na tržištu vještačke inteligencije.
“Uvijek postoji pretjerana reakcija na stvari, pa postoji i danas. Hajde da se odmaknemo i analiziramo ono što vidimo ovdje”, kaže Moris. “Prvo, nemamo stvarno razumijevanje o tome koliki je tačno trošak ili vremenski period uključen u izgradnju ovog proizvoda. Jednostavno ne znamo. Tvrde da je znatno jeftinije i efikasnije, ali nemamo dokaza za to”.
Moris je rekao da, iako se performanse Dipsika mogu porediti sa performansama OpenAI proizvoda, "još nisam vidio ništa što bi me uvjerilo da su zapravo uspjeli probiti kvantni korak u troškovima upravljanja ovakvim modelima."
Sumnje o porijeklu
Lenart Hajm, naučnik za podatke iz RAND korporacije, rekao je za Glas Amerike da iako je jasno da Dipsik ima koristi od inovativnih algoritama koji povećavaju njegove performanse, on se slaže da šira javnost zapravo zna relativno malo o tome kako je osnovna tehnologija razvijena.
Hajm kaže da je nejasno da li trošak obuke od 6 miliona dolara koji navodi Haj Flajer zapravo pokriva cjelokupne troškove kompanije - uključujući osoblje, troškove obuke o podacima i druge faktore - ili je to samo procjena onoga što bi konačna obuka imala trošak u smislu sirove računarske snage. Ako je ovo drugo, objašnjava Hajm, cifra je uporediva sa troškovima koje imaju bolji američki modeli.
Takođe je doveo u pitanje tvrdnju da je Dipsik razvijen sa samo 2.000 čipova. U blog postu napisanom tokom vikenda, on je napomenuo da se vjeruje da kompanija ima postojeće operacije sa desetinama hiljada Nvidia čipova koji su se mogli koristiti za obavljanje posla neophodnog za razvoj modela koji može funkcionisati na samo 2.000 čipova.
„Ovaj obimni računarski pristup je verovatno bio ključan za razvoj njihovih tehnika efikasnosti kroz testiranja i za pružanje njihovih modela kupcima“, napisao je on.
Takođe je istakao da je odluka kompanije da objavi R1 verziju svog modela prošle sedmice - nakon inauguracije novog predsjednika SAD - izgledala kao da je političke prirode. Rekao je da je "očito bila namjera da se uzdrma povjerenje javnosti u vođstvo SAD u oblasti vješačke inteligencije, tokom ključnog trenutka u američkoj politici".
Din W. Bol, istraživač u Merkatus centru Univerziteta Džordž Mejson, takođe je bio oprezan kada je riječ o konstataciji da je Dipsik R1 na neki način promijenio stvari u oblasti vještačke inteligencije.
„Mislim da Silicijumska dolina i Vol strit donekle preteruju“, rekao je on za Glas Amerike. “Ali na kraju dana, R1 znači da će konkurencija između SAD i Kine vjerovatno ostati žestoka i da to moramo da shvatimo ozbiljno”.
Debata o kontroli izvoza
Uspjeh Dipsika neki stručnjaci koriste kao dokaz za svoje tvrdnje da kontrola izvoza uspostavljena pod Bajdenovom administracijom možda nije imala željene efekte.
„To ukazuje da američki pristup veštačkoj inteligenciji i kontroli izvoza možda nije tako efikasan kao što zagovornici tvrde“, rekao je za Glas Amerike Pol Triolo, partner Grupe DGA-Olbrajt Stounbridž.
„Dostupnost vrlo dobrih, ali ne i vrhunskih jedinica za obradu grafičkih podataka, koje kompanija poput Dipsika, na primjer, može optimizovati za specifične obuke i radna opterećenja – sugeriše da bi fokus izvoznih kontrola na najnapredniji hardver i modele mogao biti pogrešan”, kaže Triolo.
“Ipak, ostaje nejasno kako će Dipsik biti u stanju da drži korak sa globalnim liderima kao što su OpenAI, Gugl, Antropik, Mistral, Meta i drugi, koji će nastaviti da imaju pristup najboljim hardverskim sistemima”, dodaje Triolo.
Drugi stručnjaci, međutim, tvrde da kontrole izvoza nisu postojale dovoljno dugo da bi pokazale rezultate.
Sem Bresnik, istraživač u Centru za bezbjednost i novu tehnologiju Univerziteta Džordžtaun, rekao je za Glas Amerike da bi bilo "veoma prerano" nazvati takve mjere neuspjelim.
"Generalni direktor Dipsika je rekao da je pristup računarskim resursima visokog nivoa najveće ograničenje sa kojim se suočavaju", kaže Bresnik. „Kada bi [Dipsik] imao toliko računarske moći na dohvat ruke kao Gugl, Mikrosoft, OpenAI i drugi, došlo bi do značajnog povećanja njihovih performansi. Dakle, ne mislim da stoji tvrdnja nekih ljudi da je Dipsik pokazatelj da kontrola izvoza ne funkcioniše".
Bresnik dodaje da su najoštrije kontrole izvoza uvedene tek 2023. godine, što znači da se njihove posljedice možda tek počinju osjećati. On je rekao da će pravi ispit njihove efikasnosti biti da li su američke firme u stanju da nastave da nadmašuju Kinu u narednim godinama.