Noul model de AI numit Qwen 2.5-Max a fost lansat în prima zi a Anului Nou Lunar chinezesc, un moment neobișnuit care subliniază presiunea pusă de DeepSeek asupra concurenței, atât la nivel internațional, cât și intern.
„Qwen 2.5-Max depășește la aproape toate capitolele GPT-4o, DeepSeek-V3 și Llama-3.1-405B”, au declarat oficialii diviziei de cloud a Alibaba într-un anunț oficial pe contul lor de WeChat, făcând referință la cele mai avansate modele AI open-source dezvoltate de OpenAI și Meta.
Presiunea de a avea cel mai bun model de AI
Lansările recente, precum cea a asistentului AI al companiei DeepSeek, bazat pe modelul DeepSeek-V3, și lansarea modelului R1 la 10 zile după, a luat prin surprindere Silicon Valley și a provocat scăderi ale acțiunilor companiilor din sectorul tehnologic, conform Reuters.
Declarațiile privind costurile reduse, de doar 6 milioane de dolari, cu care compania chineză DeepSeek a reușit să aducă pe piață propriul model AI, i-au făcut pe investitori să pună sub semnul întrebării planurile de cheltuieli masive ale marilor companii de inteligență artificială din SUA (despre care am scris și noi, aici).
La doar două zile după lansarea DeepSeek-R1, ByteDance, compania care deține TikTok, a anunțat, de asemenea, o actualizare a modelului său de inteligență artificială. Aceștia susțin că noua actualizare depășește modelul o1 al OpenAI în testul AIME, care măsoară capacitatea modelelor AI de a înțelege și răspunde la instrucțiuni complexe.
Valul de afirmații reflectă declarațiile celor de la DeepSeek, conform cărora modelul lor R1 rivalizează cu OpenAI o1 în mai multe teste de performanță.