Hír

Kipróbáltam a Gemini Live világbeszélő avatárját. Sokkoló volt

Estella Bathory4 days agoLast Updated: 14 April 2025

Tartalomjegyzék tartalomjegyzék A Tartalomjegyzék, amely értelmezheti a körülötte lévő világot, a tudásbank feloldása kiemelkedik a meglepő foltokban néhány ismerős buktató

Kissé zavaró, ha egy AI -t félelmetesen barátságos hangon beszélünk, és azt mondják, hogy tisztítsam meg a rendetlenséget a munkaállomásomon. Kissé büszke vagyok rá, de azt hiszem, itt az ideje, hogy a véletlenül szétszórt eszközöket rakjam össze, és takarítsuk meg a drót rendetlenséget.

A nővérem is egyetértene. De a cselekvésre való ugrás, miután egy AI „látja” az asztalomat, felismeri a rendetlenséget, és a háztartás -tanácsok a nagyobb kép. A Google Gemini AI chatbot ezt megteheti. És még sok más.

A titkos szósz itt a Project Astra elnevezésű legfrissebb funkciófrissítés. Évek óta fejlesztés alatt áll, és végül elkezdi a hónap elején elindulni. Az átfogó ötlet az, hogy minden látó, mindent halló és nyíltan intelligens AI-t szolgáljon fel a telefonján.

A Google Hawks ezeket a szuperhatalmakat meglehetősen inspiráló név alatt: Gemini Live a kamerával és a képernyőmegosztással. A vállalat DeepMind egységében fejlesztették ki, és a vállalat „univerzális AI asszisztensként” kezdte fejlesztését. Kár, hogy a végső név nem olyan törekvés.

Nadeem Sarwar / digitális trendek.

Kezdjük a hozzáférési helyzettel. A képesség már elérhető a Pixel 9 és a Galaxy S25 felhasználók számára. De ha van egy Android telefonja egy Gemini Advanced előfizetéssel, hogy vele járjon, akkor hozzáférhet az új eszközkészlethez.

Egyébként havonta 20 dollár lenne. Kipróbáltam a két fent említett telefonon, és most már készen állok arra, hogy guruljon a OnePlus 13 -on is. A legszebb rész? A hozzáféréshez nem kell részt vennie műszaki karikán.

A Gemini összehívásához szükséges Power/Volume Button kombináció vagy képernyő sarok ellop, amire szüksége van. Nem számít, milyen alkalmazást futtat, az új kamera és a képernyő-megosztó darabokhoz hozzáférhet az operációs rendszer minden sarkában.

Érzékelni a körülötted lévő világot

Először azzal kezdtem, hogy a kamerát egy festményre mutattam, és megkérdeztem róla. A Gemini Live képes volt pontosan észlelni azt Madhubani stílusú festményként, dekódolva a színek merész használatát és az állatok ábrázolását.

Nadeem Sarwar / digitális trendek.

Ezután rövid történelem leckét és az évek során kialakult variációkat adott nekem. Az információ pontos volt, a leginkább szemcsés szintre. Szerencsére dönthet úgy is, hogy egy szöveges alapú oda-vissza az Ikrekkel van, ha olyan helyen van, ahol a hangbeszélgetések kellemetlenek lehetnek.

Amit a legjobban tetszik a Gemini Live új kamerájáról és a képernyő -megosztó Avatarról, az az, hogy ez nem rendkívül chatty. Bármelyik pillanatban megszakíthatja, ami csak a beszélgetések „természetes” vonzerejét növeli.

Kipróbáltam a Gemini -t különféle forgatókönyvekben. Nem voltam felkészülve rá.

Az általa megadott válaszok általában tömörek, mintha esélyt akar adni (vagy akár meg nem is), hogy nyomon követési kérdést tegyen fel, ahelyett, hogy egy túlnyomórészt hosszú választ adna. Kitűnő a témák és a vizuális forgatókönyvek egész sorában, de van néhány buktató.

Nadeem Sarwar / digitális trendek.

Még nem tudja használni a Google Lencsét, ami azt jelenti, hogy az Ikrek nem hasonlíthatják össze a telefon képernyőjén látott képeket az interneten való megfelelő eredményekkel. Sőt, nem fér hozzá az információkhoz valós időben, ha arra kéri az Ikrét, hogy keresse meg a legújabb fejleményeket egy téma vagy személyiség körül.

Megkérdeztem a növényfajokról, az éttermi listákról, az adatok felvételéről a hirdetőtáblákról, és megértettem az orvosi receptemet a közelmúltbeli influenzára vonatkozóan. Az Ikrek elég jól teljesítettek, inkább, mint valaha az AI chatbot fellépése eddig.

A tudásbank feloldása

Ezután az Ikreket arra késztettem, hogy értelmezzem a komplex tudományos anyagot. Könyvet tettem a gépi tanulásról a kamera keretében. A Gemini Live nemcsak felismerte, hanem továbbadta, hogy áttekintést nyújtson a könyv tartalmáról és annak alapvető tárgyainak.

Nadeem Sarwar / digitális trendek.

Kíváncsi, hogy elkezdtem átjutni az oldalakon, és landoltam a fejezetlistába. Az AI felismerte az előrehaladást, abbahagyta a beszélgetést, és megkérdezte tőlem, hogy érdekel -e valamely adott fejezet, amikor megnézem a téma listáját.

Ebben a pillanatban meglepetten megdöbbent.

Megkértem, hogy bontsa le néhány összetett témát, és az AI tiszteletreméltó munkát végzett, még az oldalon túllépve, és információkat húzott a kiterjedt tudásbankból.

Például, amikor megkérdeztem a Bhisham Sahni Bevezető oldal tartalmáról, a TAMA -kban, az AI helyesen felvette a Sahitya Akademi -díj megemlítését. Ezután megemlítette azokat a részleteket, amelyeket még az oldalon sem szerepeltek, például abban az évben, amikor megnyerte a rangos irodalmi tiszteletet, és mi a könyv.

A legfontosabb oldalról a Gemini Live hindi nyelvű leolvasása szörnyű volt. Nem csak a rossz akcentus volt, hanem az a tény, hogy az Ikrek többször is kidolgozták a tiszta gibberh-et és a szavakat. Miközben megpróbálta elolvasni az urdu, a perzsa és arabul, ez jóval jobb munkát végzett, de gyakran összekeverte a szavakat a véletlenszerű vonalakból.

Nadeem Sarwar / digitális trendek.

Az urdu költészet első kísérlete során nemcsak az urdu szöveget is felismerte, hanem pontos összefoglalót is adott a versről. A legnagyobb kihívás ismét az elbeszélés volt. Az urdu anglikált változatának meghallgatása nagyon fáj a fülem.

Kiemelkedően meglepő foltokban

Az AI egy fantasztikus problémamegoldó eszköz, és számos referenciaérték van annak bizonyítására. A termodinamikával, az elektrokémiai egyenletekkel és a kézírásos notebookban megjelenő statisztikai problémákkal foglalkozó fizikai problémákkal szemben teszteltem. A Gemini Live fantasztikus munkát végzett az ilyen feladatoknál.

Még a kreatív házimunkákban is kitűnő volt. A nővérem, aki divattervező, bemutatta az egyik vázlatát a kamera nézetében, és visszajelzést és fejlesztéseket kért. A Gemini Live a tervezés dicséretével kezdte, párhuzamokat húzott néhány divatmárka tervezési ideológiájával, és maroknyi ajánlást tett.

Nadeem Sarwar / digitális trendek.

Ha tovább folytatják, az AI azt is tanácsolta a nővéremnek, hogy a kézzel rajzolt vázlatok digitális koncepciókká alakítsák a legjobb eszközöket. Ez követte ezeket az útmutató szavakat azáltal, hogy hasznos információkat szolgáltatott a szoftvercsomagról és arról, hogy hol lehet tanulni.

Amikor néhány Duracell akkumulátort tettem a kamera nézetbe, ez nemcsak pontosan felismerte őket, hanem elmondta nekem a hiperlokális e-kereskedelmi platformokat is, amelyek percek alatt képesek nekik átadni őket.

A Blinkit és a Swiggy Instamart nevű szolgáltatások csak Indiában érhetők el, és leginkább városi helyszíneken vannak fenntartva. Még egy halványan megvilágított helyiségben is képes volt azonosítani egy pár vezetékes fülhallgatót az első kísérlet során.

A helyzettudatosság az erős öltöny.

Összehasonlítva a Gemini Gemini Chat szokásos csevegésével vagy a Google -keresés AI áttekintési szakaszában, a Gemini élő beszélgetések óvatosabb megközelítést alkalmaznak a tudás kiosztására, különösen, ha ez érzékeny természetű. Észrevettem, hogy az olyan témákat, mint az élelmiszer -ajánlások és az orvosi kezelés, egyre óvatosabb megközelítéssel kezelik, és a felhasználók gyakran megzavarják a megfelelő szakértői forrást.

Néhány ismerős buktató Nadeem Sarwar / digitális trendek.

Túlnyomó elvitelem az, hogy Gemini „Project Astra” átalakítása hatalmas lenyűgöző. Ez egy pillantás a jövőbe, amit az okostelefonok elérhetnek. Néhány fejlesztéssel, integrációval és a kereszt-alkalmazás-munkafolyamatokkal a Google keresést elavult ereklyének érezheti. De egyelőre van néhány szembeszökő hiba.

Néhány alkalommal észrevettem, hogy a memóriarendszer megkerül. Amikor arra kérték az AI-t, hogy azonosítsa a fitnesz sávot a kamera nézetében, helyesen felismerte, mint a Samsung Galaxy Fit 3-at. De amikor egy nyomon követési kérdést tettem fel, tévesen érzékelte az eszközt a Huawei fitnesz sávjának.

Nyilvánvalóan hazudhat. És meglehetősen magabiztosan mondhatom. Például, amikor azt mondtam neki, hogy összefoglaljam a hordható eszköz áttekintését, az AI azt válaszolta, hogy a digitális trendek még nem vizsgálták meg. A valóságban a cikket egy hete tették közzé.

Ezután arra kértem, hogy menjen át néhány cikket a szerző oldalamon, miután engedélyeztem a képernyőmegosztást. Gemini tisztességes munkát végzett a történetek magyarázatában, de időnként megbotlott a kontextus megértésében. Például helytelenül megemlítette, hogy csak az Intel és az AMD képessé teszi az NPU -kat, amelyek jogosultak a Copilot+ jelvényre.

Nadeem Sarwar / digitális trendek.

A cikk viszont egyértelműen megemlíti, hogy a Qualcomm volt az első, aki teljesítette ezt a kritériumot, a verseny előtt. És hogy csak tavaly későn volt az, hogy az AMD és az Intel végre fel tud lépni, és megfelelhet az AI chip alapvonalnak egy új processzorportfólióval.

A cikkről szóló beszélgetés közepén ismét memória kérdésbe került. Ahelyett, hogy összefoglalná a megvitatott történetet, visszatért az első cikkről, amelyet a képernyőmegosztás útján látott. Amikor az elbeszélés közepén félbeszakítottam, Gemini kijavította a hibáját.

Egy másik kérdés, amelyet a nem angol nyelvek elbeszélésével észrevettem, az, hogy az Ikrek véletlenszerűen megváltoztatták a hangot és a tempót az elbeszélés közepén. Nagyon zavaró volt, és a kiejtés abszolút mechanikus volt, messze különbözik az emberszerű angol beszélgetési képességeitől.

Nadeem Sarwar / digitális trendek.

A gépi jövőkép küzdelmei szintén nyilvánvalóak a stilisztikai betűtípusok ellen. Néhány alkalommal magabiztosan rossz információkat ad ki, és amikor felkérik, hogy javítsa ki magát, az AI kifejezte, hogy képtelen volt megtalálni a legfrissebb információkat a témáról. Ezek a forgatókönyvek ritkák, de az Ikrek hibái itt maradnak.

Összegezve, azt hiszem, hogy a Gemini a kamerával és a képernyőmegosztással él, az egyik legnagyobb ugrás AI. Ez az eddig a generatív AI egyik gyakorlatilag kifizetődő megvalósítása. Csak annyit kell tennie, hogy a sokféleség és a „magabiztos hazug” szindróma javítása.

A dolgok határozottan a jó úton haladnak, és túlnyomórészt, de még mindig néhány kritikus mérföldkövek, attól távol, hogy a techno-turisztikus álmok tökéletes AI társa legyen.

Estella Bathory4 days agoLast Updated: 14 April 2025