Kineska kompanija za veštačku inteligenciju (AI), DeepSeek, izazvala je potres u tehnološkoj zajednici lansiranjem izuzetno efikasnih AI modela koji mogu da se takmiče sa najnaprednijim proizvodima američkih kompanija poput OpenAI i Anthropic. Osnovana u maju 2023. godine od strane Lianga Venfenga, DeepSeek je postigla ove rezultate sa delićem finansijskih sredstava i računarske snage u poređenju sa konkurentima.
DeepSeek je razvila model „reasoning“ R1, koji je objavljen 20. januara 2025. godine. Ovaj model je izazvao uzbuđenje među istraživačima i šok među investitorima, jer je postigao performanse slične OpenAI-ovom modelu o1, ali uz znatno manju potrošnju resursa. Kompanija je takođe objavila model koji može da radi sa slikama, pored teksta.
U decembru 2024. godine, DeepSeek je predstavila svoj V3 model, moćan „standardni“ veliki jezički model koji se po performansama može porediti sa OpenAI-ovim GPT-4 i Anthropic-ovim Claude 3.5. Ono što izdvaja DeepSeek jeste efikasnost u obuci modela; V3 je treniran po ceni od oko 5,58 miliona dolara, što je znatno manje u poređenju sa GPT-4, čiji su troškovi razvoja premašili 100 miliona dolara. Pored toga, DeepSeek je koristio oko 2.000 specijalizovanih računarskih čipova, konkretno NVIDIA H800 GPU-ova, što je znatno manje od drugih kompanija koje su koristile do 16.000 moćnijih H100 čipova.
DeepSeek-ov uspeh leži u postizanju veće efikasnosti kroz inovativne pristupe. Kompanija je primenila tehniku poznatu kao „sparsity“, gde se samo mali deo parametara modela koristi za određeni unos, što smanjuje potrebu za obukom. Takođe, razvili su efikasan način za kompresiju podataka, omogućavajući brže skladištenje i pristup informacijama.
Ovi modeli i tehnike su objavljeni pod slobodnom MIT licencom, što znači da bilo ko može da ih preuzme i modifikuje. Ovaj pristup može smanjiti troškove pristupa AI tehnologiji za istraživače i potrošače, omogućavajući pokretanje AI modela na ličnim uređajima umesto u „oblaku“ uz pretplatu.
Lansiranje DeepSeek-ovih modela izazvalo je značajne potrese na tržištu. Akcije tehnoloških giganata poput NVIDIA-e su pale za 17%, dok je ukupna vrednost američkih tehnoloških akcija smanjena za oko 1 bilion dolara. Ovaj razvoj događaja pokrenuo je pitanja o budućnosti američke dominacije u AI industriji i potrebi za efikasnijim pristupima u razvoju AI tehnologije.
Iako je DeepSeek postigao značajan napredak, suočava se sa izazovima poput optužbi za cenzuru u skladu sa preferencijama Komunističke partije Kine. Dugoročni uticaj na konkurente poput NVIDIA-e ostaje neizvestan, iako je njihova tehnologija i dalje ključna u razvoju AI modela.
DeepSeek-ov uspeh naglašava potencijal za postizanje visokih performansi uz efikasnije korišćenje resursa, što bi moglo redefinisati pristupe u razvoju veštačke inteligencije i otvoriti vrata manjim igračima na tržištu.
Učestvuj u diskusiji ili pročitaj komentare