AI mijenja pravila igre ili je pretjerano razvikan: DeepSeek suočen s nadzorom zbog jeftinog razvoja
Objava kineskog startupa da je razvio AI model po djeliću cijene onih iz Silicijske doline odmah je dovela u pitanje pretpostavke o američkoj dominaciji u razvoju umjetne inteligencije i vrtoglavo visokim tržišnim procjenama tehnoloških kompanija iz SAD-a.

Nakon što je izazvao šok s modelom umjetne inteligencije čije su mogućnosti konkurentne kreacijama Googlea i OpenAI-ja, kineski DeepSeek suočava se s pitanjima o tome mogu li njegove hrabre tvrdnje izdržati ispitivanje.
Objava startupa sa sjedištem u gradu Hangzhou da je razvio R1 po djeliću cijene najnovijih modela Silicijske doline odmah je dovela u pitanje pretpostavke o dominaciji Sjedinjenih Američkih Država u umjetnoj inteligenciji i vrtoglavo visokim tržišnim procjenama njegovih vrhunskih tehnoloških kompanija.
Nastavite čitati
list of 3 itemsBiden potpisao naredbu o razvoju infrastrukture za AI u SAD-u
SAD svijetu ograničava pristup čipovima za AI
Neki skeptici, međutim, osporili su DeepSeekov prikaz rada na skromnom budžetu, sugerirajući da je kompanija vjerovatno imala pristup naprednijim čipovima i više sredstava nego što je priznala.
“Veoma je otvoreno pitanje mogu li se DeepSeekove tvrdnje uzeti zdravo za gotovo. Zajednica umjetne inteligencije će kopati po njima i mi ćemo to saznati”, rekao je za Al Jazeeru Pedro Domingos, profesor emeritus informacijskih nauka i inženjerstva na Univerzitetu Washington.
“Vjerovatno mi je da mogu istrenirati model sa šest miliona dolara”, dodao je Domingos. “Također je vrlo moguće da je to samo trošak finog podešavanja i naknadne obrade modela koji košta više i da DeepSeek to ne bi mogao učiniti bez izgradnje na skupljim modelima drugih.”
U istraživačkom radu, objavljenom nedavno, razvojni tim DeepSeeka rekao je da su upotrijebili ukupno 2.000 komada Nvidia H800 GPU-a, manje naprednog čipa koji je izvorno dizajniran da bude u skladu s američkim kontrolama izvoza, i potrošili 5,6 miliona dolara za treniranje V3, temeljnog modela R1.
Generalni direktor OpenAI-ja Sam Altman izjavio je da je treniranje njegovog chatbota GPT-4 koštalo više od 100 miliona dolara, dok su analitičari procijenili da je model koristio čak 25.000 naprednijih H100 GPU-ova.
Najava kompanije DeepSeek, koju je krajem 2023. osnovao biznismen Liang Wenfeng, preokrenula je široko rasprostranjeno uvjerenje da kompanije koje žele biti na čelu umjetne inteligencije moraju uložiti milijarde dolara u podatkovne centre i velike količine skupih vrhunskih čipova. Također je pokrenulo pitanja o učinkovitosti napora Washingtona da ograniči kineski sektor umjetne inteligencije zabranom izvoza najnaprednijih čipova.
Dionice Nvidije, kompanije sa sjedištem u Kaliforniji, koja drži gotovo monopol u snabdijevanju GPU-ovima koji pokreću generativnu umjetnu inteligenciju, pale su u ponedjeljak 17 posto, izbrisavši gotovo 593 milijarde dolara s tržišne vrijednosti diva čipova, što je brojka usporediva s bruto domaćim proizvodom (BDP) Švedske.
Iako postoji široki konsenzus da DeepSeekovo izdanje R1 barem predstavlja značajno postignuće, neki istaknuti posmatrači upozorili su da se njegove tvrdnje ne uzimaju tek tako.
‘Lažni budžet’
Palmer Luckey, osnivač kompanije za virtuelnu stvarnost Oculus VR, u međuvremenu je objavljeni budžet DeepSeeka označio “lažnim” i optužio previše “korisnih idiota” da su nasjeli na “kinesku propagandu”.
“Kineski hedge fond ga gura da uspori ulaganja u američke startupove s umjetnom inteligencijom, servisira svoje vlastite kratke poteze protiv američkih titana poput Nvidije i sakrije izbjegavanje sankcija”, rekao je Luckey u objavi na platformi X.
“SAD je plodna postelja za ovakve psihopate jer naš medijski aparat mrzi naše tehnološke kompanije i želi vidjeti predsjednika Trumpa kako propada.”
U nedavnom intervjuu za CNBC, Alexandr Wang, izvršni direktor kompanije Scale AI, također je bacio sumnju na budžet DeepSeeka, rekavši da je on “razumio” da ima pristup 50.000 naprednijih H100 čipova o kojima nije mogao govoriti zbog američke kontrole izvoza. Wang nije pružio dokaze za svoju tvrdnju.
Tehnološki milijarder Elon Musk, jedan od najbližih ljudi od povjerenja američkog predsjednika Donalda Trumpa, podržao je skeptike prema DeepSeeku, napisavši: “Očigledno” na platformi X ispod objave o Wangovoj tvrdnji.
DeepSeek nije odgovorio na zahtjeve za komentar.
No Zihan Wang, koji je radio na ranijem modelu DeepSeeka, uzvratio je kritičarima startupa, rekavši: “Razgovor je jeftin.”
“Lako je kritizirati”, rekao je Wang, odgovarajući na pitanja Al Jazeere o sugestiji da se tvrdnje DeepSeeka ne smiju uzeti olako.
“Ako bi proveli više vremena radeći na kodu i sami reproducirali ideju DeepSeeka, to bi bilo bolje nego pričati”, rekao je Wang, koristeći engleski prevod kineskog idioma o ljudima koji se bave besposličarenjem.
Nije direktno odgovorio na pitanje vjeruje li da je DeepSeek potrošio manje od šest miliona dolara i koristio manje napredne čipove za treniranje temeljnog modela R1.
U intervjuu 2023. za kineski medij Waves, Liang je rekao da je njegova kompanija uskladištila 10.000 Nvidijinih A100 čipova, koji su stariji od H800, prije nego što je administracija tadašnjeg američkog predsjednika Josepha Bidena zabranila njihov izvoz.
Rast vrijednosti dionica
Korisnici R1 također ukazuju na ograničenja s kojima se suočava zbog svog porijekla u Kini, naime njegovo cenzuriranje tema koje Peking smatra osjetljivim, uključujući masakr na Trgu Tiananmen 1989. i status Tajvana.
U znaku da se početna panika oko potencijalnog utjecaja DeepSeeka na američki tehnološki sektor počela povlačiti, cijena Nvidijine dionice se ubrzo oporavila za gotovo devet posto.
Tehnološki gigant Nasdaq 100 porastao je 1,59 posto nakon pada za više od tri posto prethodnog dana.
Tim Miller, profesor specijaliziran za umjetnu inteligenciju na Univerzitetu Queensland, rekao je da je teško reći koliko bi trebalo vjerovati u tvrdnje DeepSeeka.
“Sam model odaje nekoliko detalja o tome kako funkcionira, ali troškovi glavnih promjena koje oni tvrde, koliko razumijem, ne ‘pojavljuju’ se toliko u samom modelu”, rekao je Miller za Al Jazeeru.
Miller je rekao da nije vidio nikakva “zvona za uzbunu”, ali postoje razumni argumenti i za i protiv vjerovanja istraživačkom radu.
“Proboj je nevjerovatan, gotovo ‘predobro da bi bilo istinito’. Raspodjela troškova nije jasna”, rekao je Miller.
S druge strane, rekao je, veliki pomaci se povremeno događaju u informatici.
“Ovi modeli masivnih razmjera su vrlo novi fenomen, tako da će se učinkovitost sigurno pronaći”, rekao je Miller.
“Budući da su znali da bi ovo bilo relativno jednostavno za druge da se reproduciraju, znali bi da bi izgledali glupo ako bi zafrkavali sve. Postoji tim koji je već predan pokušaju reproduciranja djela.”
Lucas Hansen, suosnivač neprofitne organizacije CivAI, rekao je da se, iako je bilo teško znati je li DeepSeek zaobišao američke izvozne kontrole, početni budžet za obuku odnosio na V3, što je otprilike ekvivalentno OpenAI-jevom GPT-4, a ne samom R1.
“GPT-4 je završio s obukom krajem 2022. Od 2022. bilo je puno algoritamskih i hardverskih poboljšanja, čime su smanjeni troškovi obuke modela klase GPT-4. Slična se situacija dogodila za GPT-2. U to je vrijeme bio ozbiljan pothvat trenirati, ali sada ga možete istrenirati za 20 dolara za 90 minuta”, rekao je Hansen za Al Jazeeru.
“DeepSeek je izradio R1 uzevši osnovni model, u ovom slučaju V3, i primjenom nekih pametnih metoda da nauči taj osnovni model da pažljivije razmišlja”, dodao je Hansen.
“Ovaj nastavni proces je relativno jeftin u usporedbi sa cijenom obuke osnovnog modela. Sada kada je DeepSeek objavio detalje o tome kako pokrenuti osnovni model u model razmišljanja, vidjet ćemo ogroman broj novih modela razmišljanja.”