Az AI sok mindent megtehet, de nem tud játékot készíteni – vagy akár le is játszani

Tartalomjegyzék Tartalomjegyzék A Microsoft Quake II Claude “Plays” Pokémon Red generál
Ahogy az AI eszközök javulnak, továbbra is arra ösztönözzünk, hogy egyre összetettebb feladatokat töltsenek el nekik. Az LLMS írhat nekünk e -maileinket, készíthet prezentációkat, tervezési alkalmazásokat készíthet, videókat generálhat, interneten kereshet és összefoglalhatja az eredményeket, és még sok minden mást. Az egyik dolog, amivel még mindig küzdenek, a videojátékok.
Ebben az évben eddig az AI (Microsoft és Antropic) két legnagyobb neve megpróbálta modelleket létrehozni vagy játékot létrehozni, és az eredmények valószínűleg sokkal korlátozottabbak, mint sokan elvárják.
Ez teszi őket tökéletes show -knak arról, hogy a Generative AI valójában jelenleg van – röviden: sokkal többet tud tenni, mint korábban, de nem tud mindent megtenni.
A Microsoft a Quake II -t generálja
A videojátékok generálásának hasonló problémái vannak, mint a videók generálása-a mozgás furcsa és morph-y, és az AI egy meghatározott idő elteltével elveszíti a kapcsolatot a „valósággal”. A Microsoft legújabb kísérlete, amelyet bárki kipróbálhat, a Quake II AI-generált verziója.
Nagyon sokszor játszottam, és ez egy igazán trippy élmény, furcsa, smudy ellenségekkel, amelyek a semmiből jelennek meg, és a környezet mozog, amikor mozog. Többször, amikor beléptem egy új szobába, a bejárat eltűnik, amikor visszafordultam, és amikor újra vártam, a falak mozogtak volna.
A valódi Quake II képernyőképe a Steam oldaláról. Gőz egy képernyőképet a Copilot által generált Quake II verziójáról. Mikrosoft
A tapasztalat csak néhány percig tart, mielőtt kivágja, és arra készteti Önt, hogy indítson egy új játékot – de ha szerencsétlen vagy, akkor még azelőtt abbahagyhatja a megfelelő reagálást.
Ez azonban egy nagyszerű kísérlet, és azt hiszem, hasznos lenne, ha több ember látja. Ez lehetővé teszi, hogy megtapasztalja magának, mi a Gen AI jó, és mi a jelenlegi korlátozásai. Bármennyire lenyűgöző, hogy egyáltalán nem tudunk interaktív videojáték -élményt generálni, nehéz elképzelni, hogy bárki játszhatnánk ezt a technológiai demót, és azt gondolhatjuk, hogy a következő Assassin’s Creed az AI fogja megtenni.
Az ilyen típusú gondolatok és feltételezések azonban léteznek, és ez nagyrészt azért van, mert az emberek nem tudják elmenekülni az AI -ről való meghallgatásról. Még akkor is, ha nem tudna kevésbé törődni a mesterséges intelligenciával, akkor az arcodon még mindig mindenhová elcsúszik. A probléma az, hogy az átlagos ember által megszerzett információk szinte teljes egészében a Big Tech Marketing és a vezérigazgatói megjegyzésekből állnak, amelyeket a sajtóközlemények felvesznek.
Ez azt jelenti, hogy az ilyen túlzott és egymással ellentmondó állításokat hallják:
Lehetséges, hogy megoldja a világ legnagyobb problémáit, például az éghajlatváltozást, a szegénységet és a betegségeket. (Bill Gates)
Valószínűleg 2025 -ben a Meta -nál, valamint a többi vállalatnál, amelyek alapvetően ezen dolgoznak, olyan AI -vel fogunk rendelkezni, amely hatékonyan egyfajta középszintű mérnök lehet, amely a vállalatánál van, amely képes kódot írni. (Mark Zuckerberg)
Az AI hatékony használata a Shopify mindenki alapvető elvárása. Ez a mai minden ügylet eszköze, és csak fontosságú lesz. Őszintén szólva, nem hiszem, hogy megvalósítható az AI -hez való alkalmazásának megtanulásáról. (Tobi Lutke, a Shopify vezérigazgatója)
Most biztosak vagyunk benne, hogy tudjuk, hogyan kell felépíteni az AGI -t, ahogyan azt hagyományosan megértettük. Hisszük, hogy 2025 -ben láthatjuk az első AI ügynököket, akik „csatlakoznak a munkaerőhöz”, és lényegesen megváltoztathatjuk a vállalatok eredményét. (Sam Altman, az Openai vezérigazgatója)
Az AI veszélyesebb, mint mondjuk, a rosszul kezelt repülőgép-tervezés vagy termelési karbantartás vagy a rossz autótermelés, abban az értelemben, hogy van, lehetősége van-bármennyire kicsi is tekintheti ezt a valószínűséget, de ez nem triviális-a civilizáció pusztulásának lehetősége van. (Elon Musk)
Ez mind nagyon szélsőséges, igaz? Ez mind megment minket, mind elpusztít minket, ez egyaránt a szakemberek minden ügyletének eszköze, és egy olyan eszköz, amely helyettesíti a szakembereket-és nyilvánvalóan ez év után a sci-fi-szintű AGI-t kaphatjuk. Amikor ez az emberek hallják, elkezdenek nagyon csodálatos dolgokat várni ezekből az eszközökből, és úgy gondolják, hogy minden irodai munkavállaló napjaikat olyan számítógépekkel beszélgetnek, mint a Star Trek karakterek.
Ugyanakkor nem így néz ki a valóság. A valóság úgy néz ki, mint egy trippy, smudy Quake II, érthetetlen formákkal az ellenségek számára. A Chatgpt-szintű LLM-ek valóban izgalmas áttörés volt 2022-ben, és rengeteg móka mindenkinek, akivel játszhat-de a nagy technikák többsége számára jelenleg ránk szorul, az AI nem eléggé képes. A pontossági szintek túl alacsonyak, az oktatáskövetési képességek túl alacsonyak, a kontextus ablakai túl kicsik, és csak a valós tudás helyett az internetes ostobaságon képzik őket.
De a videojátékok generálása elég összetett cél – elvégre egész embercsoportot igényel, hogy ezeket a dolgokat elkészítsék. Mi lenne, ha inkább videojátékokat játszana?
Claude “Plays” Pokémon Red Claudeplayspokemon
Nos, kiderül, hogy az emberek is kísérleteznek ezzel. Az Antropic legújabb modellje, a Claude 3.7 Sonnet már két hónapja játszik a Pokémon Red -et a Twitch -en, és a legjobb munkát végzi, amelyet az LLM valaha elvégzett a Pokémon játékában. Az egyik enyhe figyelmeztetés azonban az, hogy még mindig mérföldre van az átlagos 10 éves ember mögött.
Az egyik probléma a sebesség – Claude több ezer akcióra van szükség, amely több napig tartó cselekedeteket végez ahhoz, hogy a Viridian Forest -en keresztül megvalósuljanak.
Antropikus
Miért tart olyan sokáig? Nem azért, mert nem tudja kitalálni, hogyan lehet stratégiailag megnyerni a Pokémon csatákat – valójában ez az a rész, ahol a legjobb. Navigálás a környezetben, és elkerüli a fákat és az épületeket, másrészt – nem olyan jó. Claude -t még soha nem képezték a Pokémon játékára, és neki nem könnyű megérteni a pixel művészetet és azt, amit ez képvisel.
Különösen nehéz a labirintus típusú területeken, mint például a Mt. Moon-ban való átadása, mivel küzd a terület térképének elkészítése és a lépéseinek visszavonása érdekében. Egyszer annyira beragadt egy sarokba, hogy arra a következtetésre jutott, hogy a játék megszakadt, és hivatalos kérést generált a játék visszaállításához.
Ezek a korai kísérletek nem voltak a Levity pillanatai nélkül.
Egy alkalommal Claude beragadt egy sarokba, és – meg kell határozni valamit, meg kell szakítani – a játék visszaállításának hivatalos kérésére. pic.twitter.com/5riicjdxcm
– Antropikus (@anthropicai) 2025. február 25 -én
Nem is nagyszerű, hogy emlékezzen arra, hogy mi a célja, milyen dolgokat próbált meg, vagy mely helyeken már volt.
Ennek egy nagyon egyszerű oka van ennek – az LLMSnek egy véges „kontextus ablaka” van, amely memóriájaként működik. Csak annyi információt tud tárolni, és amint Claude eléri a határértéket, kondenzálja azt, amit meg kell tennie. Tehát egy olyan információ, mint a „meglátogatott Viridian City, belépett minden épületbe, és minden NPC -vel beszélt”, megkönnyítheti, hogy csak „meglátogatta a Viridian City -t” – Claude -t arra késztette, hogy térjen vissza, és ellenőrizze, hogy van -e még több tennivaló a városban.
Összegezve: Claude nem tudja kitalálni, hová megy, a falakba sétál, véletlenszerű tárgyakat hibáztat az NPC -k számára, elfelejti, hol volt, és mit próbál meghozni, és minden döntéshez, amelyet meghoz, bekezdéseket és az érvelés bekezdését igényli. Ez nem kritika – ezek egyaránt izgalmas kísérletek, amelyek az LLM -eket, amennyire csak tudnak, nyomják.
De az AI körüli összes hype -vel fontos érzés, hogy az emberek látják az ilyen demókat, és saját gondolatukat készítsenek az AI -ről. Bizonyos figurák megpróbálják eljuttatni azt a narratívát, miszerint elérjük a csúcsot – hogy évek óta az AI meghaladja a legokosabb embereket is -, de nem hiszem, hogy őszinteek, csak eladók. Semmi közel állunk a csúcshoz, ez az egész csak most kezdődik.