Bilo je neizbježno da će američka dominacija nad sektorom umjetne inteligencije dobiti nekakvu konkurenciju, ali da će se ta konkurencija pojaviti u obliku tehnološke macole i doslovno preko noći izbrisati stotine milijardi dolara vrijednosti u nekima od najvećih svjetskih kompanija i utjerati strah u kosti i Wall Streetu i Silicijskoj dolini - e to je već bilo malo teže očekivati.
Naime, otkako je kineski startup DeepSeek u javnost pustio svoj model umjetne inteligencije (AI), ulagači u posljednja dva dana masovno rasprodaju skupo kupljene dionice u američkim tvrtkama iz sektora, šokirani generalnom kvalitetom i sposobnošću kineskog modela koji je višestruko jeftiniji.
Ono što je zapanjilo promatrače jest koliko je po svojim sposobnostima DeepSeekov model R1 blizu konkurenciji kao što je, recimo, OpenAI Sama Altmana i njihov ChatGPT, a sve uz korištenje dramatično manje količine resursa. Naime, treniranje AI modela je abnormalno skupo.
Evo za početak samo jedna usporedba; OpenAI, Antrophic i ostale slične kompanije troše više stotina milijuna dolara samo na računalni hardver. Potrebni su im gigantski podatkovni centri, koji koriste na tisuće grafičkih procesora plaćenih i po 40 tisuća dolara.
DeepSeek je, prema navodima AI eksperta Morgana Browna, svoj model uspio istrenirati za samo dva mjeseca i oko 5 milijuna dolara (Meta otprilike toliko troši samo na plaće svojih zaposlenika koji rade na njihovom AI modelu). Osim što je višestruko jeftiniji, kineski startup ima još dvije ključne prednosti u odnosu na američku konkurenciju: troši nemjerljivo manje struje i - a ovo je možda najvažnije od svega - radi se o “open source” modelu.
PROČITAJTE VIŠE Kako je Liang Wenfeng šokirao američke divove i postao nacionalni heroj Kine!
Open source ili sustav otvorenog koda znači da je tehnologija na kojoj je DeepSeek izgrađen dostupna apsolutno bilo kome na svijetu. Bilo koja tvrtka iz Gunje ili klinka iz Kandahara smije uzeti DeepSeekov kod i od njega napraviti svoj biznis. Ne treba možda ni napominjati da to kod američkih firmi nije slučaj; svoje modele skupo naplaćuju.
A pošto je možda i najimpresivnije od svega to što je DeepSeek sve ovo izveo bez pristupa najnaprednijim američkim i tajvanskim čipovima (koje ne smiju koristiti zbog američkog embarga), to znači da ne treba imati ni preveliku i preskupu hardversku pozadinu da bi se DeepSeek u potpunosti upogonio.
Unutar AI revolucije koja ionako prijeti da će cijeli svijet pretumbati i rastaviti na proste faktore, DeepSeek bi tako mogao biti revolucija sam za sebe.
Stvari se događaju nevjerojatnom brzinom i na brojnim frontovima pa je pohvatati sve konce situacije praktički nemoguće, no brojne osnovne stvari itekako se znaju. Prije svega, DeepSeek je kompanija iz kineskog Hangzhoua koja je izrasla iz sveučilišnog startupa.
Iza nje stoji relativno tajnoviti poduzetnik i voditelj fonda rizičnog kapitala Liang Wenfeng s timom koji broji samo 200-tinjak ljudi (dramatično manje od konkurenata, treba li uopće napominjati), a cilj tvrtke jest kreirati takozvanu “generalnu umjetnu inteligenciju”, što je termin koji označava AI model koji postiže razinu i način funkcioniranja ljudske inteligencije.
Valja napomenuti da je to cilj praktički svih AI divova i da ga još nitko nije postigao. Međutim, DeepSeek je cijeli proces izgradnje AI modela preokrenuo na glavu pa nije nemoguće da su na tom putu dalje od ostalih (dok ovo čitate doslovno tisuće eksperata češljaju sve linije DeepSeekova koda i u narednim danima doći će puno više odgovora na pitanja koja su sada još nepoznanica).
PROČITAJTE VIŠE Divovi iz Silicijske doline u nevjerici, nova tvrtka napravila aplikaciju koju svi skidaju: ‘Ovo je revolucija!‘
Uglavnom, dok je treniranje tradicionalnih AI modela kao pisanje svakog broja sa 32 decimale, DeepSeekovi inženjeri su odlučili pisati po 8 decimala. Rezultat je nešto slabiji ili barem tek nešto sporiji proces - ali uz 75 posto manji utrošak memorije.
Nadalje, DeepSeek koristi takozvani “multi-token” sustav. Spomenuti Morgan Brown to objašnjava ovako: dok normalni AI čita kao učenik prvog razreda - “Mačka … je … sjela …” - DeepSeek čita kompletne fraze odjednom. Rezultat je da je dvaput brži, a gubi samo 10 posto na točnosti.
No ono što je vjerojatno daleko najbriljantniji pomak jest da su napravili diverzifikaciju svog modela na svojevrsne sektorske stručnjake. Umjesto da kao standardni AI modeli znaju sve (kao da je jedna osoba istovremeno i liječnik i odvjetnik i inženjer), DeepSeek ima zasebnog liječnika, odvjetnika i inženjera i aktivira ih samo onda kada su doista potrebni.
Rezultat toga jest da je kod tradicionalnih AI modela istovremeno aktivno svih 1800 milijardi parametara. DeepSeek ima ukupno 671 milijardu parametara, ali je samo 37 milijardi aktivno u svakom pojedinom trenutku. Vjerojatno vam je jasno da to znači ogromne uštede u resursima.
Kolike? Spomenuli smo već da je treniranje modela barem 20 puta jeftinije, ali to je tek početak. Dok ostali trebaju, recimo, 100.000 grafičkih procesora, DeepSeek treba 2000.
A pritom to ne moraju biti ultraskupi procesori napravljeni za data centre, nego, u osnovi, grafički procesori napravljeni za gejming računala kakvi se mogu kupiti u bilo kojem dućanu s računalnom opremom.
Ne čudi stoga što je NVIDIA, tvrtka koja je najviše profitirala na tim ekstremno skupim AI čipovima, zabilježila najveći jednodnevni burzovni gubitak u povijesti, skoro 600 milijardi dolara. Ukupno su američke tehnološke tvrtke skliznule za bilijun dolara, odnosno 1000 milijardi.
Prema dosad analiziranim podacima, DeepSeekov R1 je po performansama otprilike na razini OpenAI-jeva modela o1, koji je korisnicima ChatGPT-ja postao dostupan u prosincu. Od ponedjeljka je DeepSeek sa svojom ikonom plavoga kita najskidanija aplikacija u velikom dijelu svijeta i u Appleovom App Storeu i u Googleovom Play Storeu, a odmah jučer našli su se pod cyber napadom, zbog čega su morali privremeno suspendirati nove registracije.
PROČITAJTE VIŠE U povijesti SAD-a, ovo se još nije dogodilo: Sve što smo mislili da znamo o umjetnoj inteligenciji, Kinezi su upravo razbili u komadiće
Sada je situacija stabilizirana i imali smo priliku sami isprobati sustav i mora se priznati kako je riječ o vrlo impresivnom proizvodu. Ukratko, možete mu postaviti bilo koji zadatak ili pitanje (i na hrvatskom jeziku) i DeepSeek će vam prvo na engleskom izbrifirati čitav svoj “misaoni proces”; koje podatke koristi, na koji način i zašto i potom dati odgovor na hrvatskom.
Znanstvenici potkovaniji od nas potvrdili su kako su impresionirani sposobnošću modela R1 da se pozabavi kompleksnim misaonim zadacima, poglavito kada je riječ o matematici i kodiranju, te kako se čini da proizvodi rezultate koji su usporedivi s konkurencijom, ali uz djelić utroška računalne i energetske snage.
Eksperte je posebno impresioniralo to što riječ o modelima koji se mogu sami unaprijeđivati, bez potrebe za ljudskim nadzorom. Upravo to se smatra ključnim korakom prema pravoj generalnoj umjetnoj inteligenciji.
Isto tako, prošlotjednom objavom svih tehničkih papira DeepSeeka široka javnost prvi je put dovela uvid u to kako se doista treniraju AI modeli.
Naravno, ne treba ovdje biti naivan pa zanemariti politički moment. DeepSeek zasigurno nije pušten na ovaj način i točno u ovom trenutku sasvim slučajno. Prošlo je samo tjedan dana od inauguracije Donalda Trumpa, a američki i globalni fondovi od njegove pobjede pa do praktički jučer upumpali su dodatne stotine milijardi dolara u dionice “Big Tech” kompanija, ponajviše kladeći se na to da će se nastaviti rast pogonjen AI-jem.
Većina tog novca bila je predviđena za izgradnju računalne infrastrukture kao što su data centri (bez koji se, tako se mislilo, ne može razvijati AI) te energetskih kapaciteta koji su - smatralo se - nasušno potrebni kako bi se ti centri hranili električnom energijom. DeepSeek je sada cijelu tu paradigmu stavio pod znak pitanja.
“DeepSeek R1 je Sputnik AI svijeta”, napisao je koncizno na X-u poznati tech investitor Marc Andreessen, aludirajući na to da je, zapravo, Kina ispalila prvi satelit u AI svemir i da SAD sada treba junački potegnuti kako bi prvi došao do Mjeseca.
Donald Trump je pak poručio kako DeepSeek treba pozlužiti kao “poziv na buđenje” američkim kompanijama, koje se moraju “laserski fokusirati na pobjedu”.
DeepSeekov trenutačni trijumf nikako ne znači da je utrka ggotova; kineski insajderi strahuju da bi nakon što Nvidia izbaci novu generaciju svojih procesora Blackwell jaz između američkih i kineskih AI tvrtki mogao ponovno postati onako velik kao što je bio prije DeepSeeka.
Za sudjelovanje u komentarima je potrebna prijava, odnosno registracija ako još nemaš korisnički profil....