Meta Dobded Llama 4: Mit kell tudni a két új AI modellről

A Meta szombaton mutatta be legújabb generációs AI modelljét. Adhat a Llama 4 modelleknek egy tesztvezetést most a Meta AI weboldalán keresztül, és a Llama 4 hamarosan táplálja a vállalat Instagram, a WhatsApp és a Messenger Services sok Meta AI funkcióit.
A Meta és más AI társaságok közötti verseny egyre intenzívebbé válik. A vállalatok azon dolgoznak, hogy olyan AI modelleket építsenek és adjanak ki, amelyek összetettebb feladatokra és fejlett érvelésekre képesek anélkül, hogy hatalmas mennyiségű számítási energiát és készpénzt igényelnének a futtatáshoz. Ez egy trükkös édes hely, amelyet meg kell találni, és a Meta reméli, hogy legújabb modelljei a versenytársak előtt állnak, mint például a Chatgpt és az Ikrek.
Két modell található a Llama 4 családban: Scout és Maverick. Nyílt súlyú modellek és multimodális modellek, ami azt jelenti, hogy szöveget, képeket és kódot tudnak előállítani. Az olyan nyitott modellek, mint a Meta azt jelenti, hogy a fejlesztők betekintést nyújthatnak a modellek felépítésébe. A LLAMA 4 modellek nyitott súlyú modellek, ami azt jelenti, hogy láthatja, hogy a modell hogyan alakítja ki a kapcsolatot, és hogyan adnak bizonyos jellemzőket nagyobb súlyt, ahogy megtanulják. Az Openai a hónap elején bejelentette, hogy először fejleszti ki egy nyílt súlyú modellt.
A Scout a család legkisebb modellje, amelyet egyetlen NVIDIA H100 GPU futtatására terveztek. A Scoutnak 10 millió token kontextusú ablaka van, és egy 17 milliárd paraméter -modell, amely 16 szakértőt tartalmaz (a modell alhálózata, lehetővé téve a feladatok hatékonyabb futtatását). A Scout több mint kétszerese a Llama 3 tűzerőnek, amelynek 8 milliárd paramétere van. Általában, minél több paraméter van a modellnek, annál képesebb a jobb eredmények gyorsabb elérése.
A Maverick egy közepes méretű modell, a Scout Big Brother, 17 milliárd paramétert tartalmaz 128 szakértővel. A Meta szerint a benchmark-tesztek azt mutatták, hogy a Maverick legyőzte a CHATGPT-4O-t és a DeepSeek V3 szöveges generációját. A DeepSeeknek még mindig van előnye az érvelés és a kódolás szempontjából. A CNET nem függetlenül ellenőrizte a Meta referencia -tesztjeit.
Mark Zuckerberg vezérigazgató által közzétett videó szerint további információt a Llama 4 család többi tagjáról, beleértve a Behemoth nevű alapmodellt és a Llama 4 érvelési modelljét is. Valószínűleg többet megtudunk ezekről a modellekről a Llamacon -ban, a cég első éves AI Developers konferenciáján, április 29 -én kezdve.
További információkért nézze meg, mit tudunk a Meta AI potenciális önálló alkalmazásáról és a legjobb AI chatbotok áttekintéséről.