La începutul acestei săptămâni, aplicația AI Assistant a depășit ChatGPT și a devenit aplicația gratuită cu cel mai mare rating care este disponibilă în Statele Unite, conform Reuters.
Succesul DeepSeek-V3
Acest succes se datorează modelului DeepSeek-V3, despre care creatorii de la DeepSeek afirmă că „conduce clasamentul prin modelele open-source și concurează cu cele mai avansate modele closed-source la nivel global”.
DeepSeek a reușit să schimbe percepția larg răspândită despre supremația SUA în domeniul AI și despre eficiența controalelor de export impuse de Washington, care sunt menite să limiteze accesul Chinei la cipuri și tehnologii avansate de AI.
Modelele AI, de la ChatGPT la DeepSeek, necesită cipuri pentru antrenarea lor. Administrația Biden a extins, încă din cu 2021, interdicții care au împiedicat exportul acestor cipuri către China, în încercarea de a preveni folosirea lor în antrenarea modelelor AI chinezești.
Cipuri de 6 milioane de dolari
Cercetătorii DeepSeek au scris luna trecută într-un articol că modelul DeepSeek-V3 a fost antrenat folosind cipuri Nvidia H800, care au dus la costuri de mai puțin de 6 milioane de dolari. Chiar dacă această informație a fost contestată ulterior, faptul că s-au utilizat cipuri mai puțin avansate decât cele pe care Washington încearcă să le blocheze, cu costuri mai mici de antrenare, a dus la întrebări în rândul executivilor din tehnologie din SUA cu privire la eficiența controalelor de export.
Puține lucruri sunt cunoscute despre compania din spatele DeepSeek. Este un startup mic, din Hangzhou, China, care a fost fondat în 2023, anul în care motorul de căutare Baidu a lansat primul model chinezesc AI de tip LLM (large-language model).
De atunci, chiar dacă zeci de companii bazate în China și-au lansat propriile lor modele AI, DeepSeek este prima care a fost lăudată de industria tehnologică din SUA pentru că egalează sau chiar depășește performanțele modelelor americane de ultimă generație.