Hír

A DeepSeek új riválisával rendelkezik, és most kipróbálhatja

Estella Bathory2 weeks agoLast Updated: 6 March 2025

Az Alibaba nemrégiben mutatta be legújabb érvelési modelljét, és úgy tűnik, hogy a Deepseeknek és az Openai -nak aggódni kell – legalábbis, ha az Alibaba összes ígéretének igaza van. Ez nyílt forráskódú, ezért megnéztem. INGYEN kipróbálhatja, bár nem meglepő, hogy rájössz, hogy vannak olyan dolgok, amelyekről nem fog beszélni veled.

Az új modell, a QWQ-32B-nek (Quan-With-Questions) elnevezésű modell sokkal kevesebb paraméteren fut, ami azt jelenti, hogy kevesebb erőforrást igényel, de az Alibaba azt állítja, hogy ugyanolyan szinten teljesít, mint a DeepSeek vagy az Openai O1-Mini.

A DeepSeek R1 nagy nyelvi modellje (LLM) február elején volt a düh, amikor megjelenik, hirtelen képesek voltak a Chatgpt és más alternatívák által beállított aranyszabvány versengésére, de sokkal alacsonyabb költséggel. Úgy tűnik, hogy az Alibaba itt még tovább tolja a borítékot.

Nadeem Sarwar / digitális trendek

Amint azt a VentureBeat kifejtette, a DeepSeek-R1 671 milliárd paramétert igényel, amelynek 37 milliárdja aktiválódik. Eközben az Alibaba új QWQ-32B-je 32 milliárd paraméterrel járhat. Ezek a számok sokak számára teljesen elvontak, de óriási különbség van a számítási teljesítményben; Míg a DeepSeek R1 1600 GB-os VRAM futtatásához szükséges, a QWQ-32B mindössze 24 GB-os VRAM-mal eljuthat. A legtöbb esetben ez azt jelenti, hogy az NVIDIA H100 vagy ekvivalensei, de még a játékra összpontosító RTX 4090 Sports 24 GB-t is. A legújabb RTX 5090 UPS THS 32 GB -ig.

Az Alibaba QWQ-32B egy Apache 2.0 licenc alatt érhető el, ami azt jelenti, hogy a vállalatok és a kutatók használhatják azt. Ennél is fontosabb, hogy felhasználhatjuk az Alibaba Qwen csevegésének kipróbálásával. A DeepSeekhez hasonlóan, néhány korlátozással is jár, de van néhány azonnali előnye, amelyeket elég gyorsan észrevettem.

Úgy tűnik, hogy még a gyors, egyszerű kérdésekre is meglehetősen mélyreható választ ad. Ez jó lehet, de bizonyos értelemben többnyire bosszantó volt, mivel sok felesleges kontextust ad neked, amelyet nem kértél. Tetszik, hogy ez megmutatja a teljes érvelési folyamatát, ami hasonló a Chatgpt mély gondolkodásmódjához – de sokkal kevésbé mélységgel.

Amikor a politikai ügyekről kérdezik, a Qwen csevegés nem megfelelő. Lehet, hogy vannak módjai a börtönbe – elvégre a DeepSeek -rel is lehetséges -, de még nem sikerült.

Meg kell látni, hogy az Alibaba állításai igaznak bizonyulnak -e, de úgy tűnik, hogy a Chatgpt és a DeepSeek új riválisa van.

Estella Bathory2 weeks agoLast Updated: 6 March 2025