Hír

Hagytam, hogy a Gemini összetett kutatást podcastokká alakítson. Soha nem megyek vissza

Tartalomjegyzék tartalomjegyzék Az egészet podcastvá alakítva, hogyan segített nekem? Kényelem, mindenekelőtt hatékonyabb, túl néhány gubanc

A Google Assistant és az Ikrek korszakától való elmozdulás szinte az utolsó szakaszában van. Nosztalgikusan érezhető az névadó virtuális asszisztens iránt, de tagadhatatlan, hogy az Ikrek érkezése valóban megváltoztatta azt, amit az AI ügynök megtehet értünk.

A nyelvi megértési darabok sokkal jobbak az Ikreknél. A beszélgetések természetesek, az alkalmazás interakciói folyékonyak, az integráció más Google termékekkel is jutalmazó, és még szabad állapotában is a Gemini a Siri -t a tisztítószerekbe veszi az iPhone -on.

Van azonban néhány trükk, amelyek az Ikrét teljesen más bajnokságba helyezik. A mély kutatás egyike azoknak az ügynöki tulajdonságoknak, amelyeket napi rendszerességgel használok, és továbbra is csodálkozom. Márciusban a Google újabb jutalmazó funkciót adott hozzá a Gemini Arsenalhoz: audio áttekintéshez.

Az egészet egy podcast Nadeem Sarwar / digitális trendekké alakítva

Képzelje el, hogy a DRAB-dokumentumokat, a nyíltan összetett kutatási dokumentumokat vagy az akadémiai olvasóanyagot élénk kétirányú podcast-csevegésgé változtatja. Alapvetően erről szól az audio áttekintés. A szolgáltatás először a Google mélyen alulértékelt NotebookLM -jén érkezett, és végül átkerült a mobil és a web alapvető Gemini élményére.

Nem kell részt vennie műszaki karikain, vagy nem kell egy hiper-specifikus szöveges üzenetet írnia, hogy megkapja ezeket a hangos átalakításokat. Csak töltsön fel egy fájlt a mellékletválasztóból, és látni fogja, hogy egy „Audio áttekintés” chip jelenik meg közvetlenül a csevegődoboz felett. Koppintson rá, és megkezdődik a podcast generáció.

Néhány percig tarthat, amíg a befejezés, de közben biztonságosan válthat egy másik alkalmazásra (vagy ablakra). Miután a folyamat véget ért, értesítést kap arról, hogy a podcast készen áll a hallgatási örömére, vagy megosztja másokkal.

Az audio áttekintés jellemzően kétszemélyes, szabadon folyó csevegés, félelmetes természetes hangon. Szinte úgy érzi, mintha a Gemini Live -szel beszélgetne, ami maga is drámaian természetesnek érzi magát, mint bármelyik AI chatbot, amelyet eddig használtam a hangbeszélgetés módban.

Azt mondanám, hogy ezek az AI által generált podcastok általában nagyon jól elkészítettek. De néhány okból vonzom őket. Először egy képernyőre bámulom, elolvastam a kutatási cikkeket, és saját cuccaimat írok, egészen az egész nap.

Nadeem Sarwar / digitális trendek

Ez kevés helyet hagy a további szöveges anyagokhoz való kapcsolattartáshoz, legyen az akadémiai, munkával kapcsolatos vagy akár rekreációs. Ha azonban meg tudnám változtatni az érzékszervi módot, hogy kapcsolatba léphessek az anyaggal, az olvasási fáradtságom hátsó ülést vesz igénybe.

Az audio podcastok egy teljesen új módszert kínálnak a szöveges alapú anyagok magával ragadó részvételére. Ez a második előnyhöz vezet, amely szenzoros stimuláció vagy variancia. Ezt a képletet jól dokumentálták és kísérletezték az akadémia és a professzionális coaching területén.

Hogyan segített nekem?

A szöveges fáradtság megteszi a saját útdíjat. Ez még az izgalmas munkát is úgy tűnik, mint egy házimunka, amelyre el kell mennie, csak azért, mert nem engedheti meg magának, hogy kihagyja. Ugyanakkor ugyanazzal a munkával vagy annak lényegével való részvétel egy másik szenzoros médián keresztül elnyomja azt a félelmet, hogy a több szöveges alapú anyag túlterhelje. Valójában néhány más módon is segít.

„A több érzék bevonása erősíti a memóriát. Amikor hallgatunk és kölcsönhatásba lépünk – akár olvasás, írás, vagy csinálás révén – az agy erősebb kapcsolatokat épít fel, megkönnyítve a későbbi visszahívást” – mondja Yasir Naseem, a nyelvészeti szakértő, akinek a kutatási munkája az oktatási módszerek korszerűsítésére és szerencsejátékára összpontosított.

Naseem, aki jelenleg egy vezető Ed-Tech cég tantervének szakértője, azt mondja nekem, hogy nem hagyhat ki kizárólag egyetlen médiumot a tanuláshoz. Ehelyett, azt mondja, hogy a maximális haszon érdekében különböző módszereket kell egyesítenie, kezdve a szentimentális hatástól a memória megtartásáig.

Nadeem Sarwar / digitális trendek

A Computers & Education Journal -ban közzétett kutatások azt is kiemelték, hogy a hallgatók hogyan találták az audiofájlokat a felsőbb tanulási és revíziós anyagnak. A rugalmasság és az érzékszervi sokoldalúság nagy szerepet játszott abban, hogy podcastokat részesítenek előnyben más médiumokkal szemben.

„A valódi megértés és a hosszú távú megtartás akkor történik, amikor a hallgatás látványosságokkal, megbeszélésekkel vagy gyakorlati tevékenységekkel párosul”-tette hozzá Naseem. A Gemini audio -áttekintésével kapcsolatos saját tapasztalataim visszatükrözik a tanácsát. Erősebb emlékezetem van az audio podcastokon keresztül felszívódott tudásról, összehasonlítva az ugyanazon anyag olvasásával.

Látja, ezek az audio podcastok nem egyszerű szöveg-audio konverzió. Ehelyett egy egyébként unalmas szövegfalat bontanak egy kétszemélyes beszélgetésre, amelyben lényegében az egyetlen közönség vagy. Ez egy áldás minden olyan szöveges anyag számára, amely nem váltja ki azonnal a kíváncsiságát, és azonnali olvasásgá tesz téged.

Legutóbbi kísérletemben a Gemini audio podcastja segített megérteni egy olyan cikk jelentőségét, amely „a helyi információk-elméleti célok funkcióin alapuló értelmezhető idegi tanulás keretét tárgyalja”. Egyszerűbb módon a kutatás megvitatta, hogy az idegsejtek hogyan szervezik meg magukat.

Megkapod azt a pontot, amelyet itt próbálok elkészíteni, igaz?

Kényelem, mindenekelőtt a Nadeem Sarwar / digitális trendek

A kényelem fontos szerepet játszik az információk elnyelésében. Ugyanúgy, mint a lelkesedés és az izgalom az egész folyamat iránt. A Computers in Human Behavior Journalban közzétett cikk szerint a podcastok „javítják a kényelmet, a rugalmasságot és az információkhoz való hozzáférést”. Nem tartott sokáig, hogy ezt felismerjem.

A nemzeti fővárosban élve, a forgalomba vagy a nyilvános ingázásba ragadt 2-3 órás költés számomra napi valóság. De az egész kellemetlenségénél inkább a leginkább az elpazarolt idő fáj. Az audio tanulási anyag a legkényelmesebb módszert kínálja az idő eredményes felhasználására.

A Gemini -vel egy másik kritikus előnye van. Nem kell támaszkodnia egy bizonyos könyv, hírcikk vagy tudományos anyag audio elérhetőségére. Csak letöltheti bármilyen anyagot, amely a rendelkezésére áll, és az Ikrek podcast-stílusú beszélgetésgé változtatják.

Rengeteg multidiszciplináris kutatás folyik, amelyek támogatják az audio-alapú megközelítés előnyeit a tanulásban. És nem kizárólag a hallgatásról, hanem a dolgok lebontásáról és a megközelíthetőbb bemutatásról szól.

“Néhány ember azt mondta … nekik tetszik, hogy adunk nekik olyan dolgokat, amelyeket nem olvasnak az újságban. Tetszik a tény … megpróbálunk másképp bemutatni magunkat” – mondja egy kutatási cikk, amely a hírszerkesztőt idézi. A Syracuse Egyetem jóvoltából a podcast trend korai napjaiban 2006 -ban jelent meg.

Nadeem Sarwar / digitális trendek

2025 -től a podcastok valódi jelenséggé váltak az információk fogyasztásához, az oktatási anyagoktól a szórakoztató dolgokig. A Pew Kutatóközpont szerint az amerikaiak csaknem fele foglalkozott podcastokkal. A megkérdezett közönség több mint fele hallgatta a podcastokat a tanuláshoz, a szórakozáshoz, vagy hogy valamilyen audio anyag legyen, miközben valami mást csinál.

Majdnem egyharmada meg akarta hallani mások véleményét, és egy másik ugyanolyan nagy szegmenst csatlakoztattak, hogy szemmel tartsák a híreket és a jelenlegi eseményeket. Az elkötelezettségem nem esett túl messzire a fent említett mintától. A hosszú formájú újságírói történetek vagy nyomozási munkák során gyakran kellemesebbnek találtam a podcast verzióját.

Hatékonyabb is

Érdekes módon úgy tűnt, hogy a podcastok gyakorlati változásokat is vezetnek. A hallgatók nagyjából kétharmada, akik egy podcast meghallgatása után könyvvel vagy filmmel foglalkoztak, a közönség több mint fele elkezdett követni egy személyt a közösségi médiában, és egyharmaduk életmódbeli változtatásokat hajtott végre, például testmozgást vagy étrend megváltoztatását.

A Journal of Social Media Marketingben közzétett kutatások kiemelte a média helyettesítését és a funkcionális hasonlóságot a média meghallgatása és a közönség hajlandóságának összefüggésében. Az átfogó ötlet az, hogy a felhasználók értékelik a médiumot, és kiválasztják a legjobban megfelelõt.

“A podcast -tartalom egyedisége érdekében a hallgatás hajlandóságának és a média helyettesítésére gyakorolt ​​hatása pozitív, ami arra utal, hogy az egyedi tartalom, a magas színvonalú és a sokféleség miatt az emberek podcastokat szeretnének hallgatni” – mondja a cikk. Személyesen igazolhatom ezt a megállapítást.

pic.twitter.com/mhdugg1zdg

– Nadeemonics (@nsnadeemsarwar) 2025. március 30 -án

Az elmúlt napokban számos kutatási cikk van „podcast-et”, amelyben megvitatom a rost, a hús és a csomagolt élelmiszer-fogyasztás hatását az alvási szokásokra, a kognitív egészségre és a bél egészségére. A tudományos papírok nyíltan technikai hangjához képest, ha két házigazdája „szentimentális” és „meggyőző” hanggal bontja le az eredményeket, észrevehetően mélyebb hatással volt rám.

Gondolj úgy, mint egy könyvben a társadalmi etikettek vagy a kulturális érzékenység megismerése. És évekkel később, amikor a saját szemével látta őket akcióban. Vagy gondoljon egy idegen nyelv megtanulására egy könyvből, mindegyik önmagában, és a különbség, amikor megtanulja azt egy személytől, aki az összes tudást a fülébe tölti.

Ez utóbbi megközelítés jobb eredményeket nyer. És ez elsősorban azért van, mert a multi-szenzoros elkötelezettség összetett hatása felgyorsítja a tanulási folyamatot, vagy csak hatékonyabbá teszi. A Gemini audio -áttekintése hasonló hatást váltott ki, és sokat segítettek nekem.

Néhány gubanc

Bármennyire is produktív, mint minden hangzik, az Ikrek audio áttekintése nem. A „Podcasti-Fication” erőfeszítéseiben kiüríthetik egy ízlésesen megírt történet valódi lényegét, vagy néhány apró részletet kihagyhatnak. Van néhány funkcionális furcsa is. Az audio áttekintés hossza, amely közvetlenül megfelel a forrásanyag mélységének, meglehetősen véletlenszerű lehet.

Az a kutatási munka típusa, amelyet podcastokká alakíthat. Nadeem Sarwar / digitális trendek

Például, amikor egy 260 oldalas könyvet etettem a perzsa nyelv konjugációk és morfológiájának témájáról, a Gemini által generált audio-áttekintés alig több mint hét perc volt. Minőségi szempontból ez a legfontosabb alkatrészeket fedezte, de a finomabb részletekből kimaradt.

Egy másik esetben a négy oldal értékű mély kutatási dokumentumot audio podcastvá alakítottam. Ennek időtartama körülbelül 13 perc volt. Sajnos a Gemini automatikus feladat chipje nem engedi, hogy beállítsa a hang áttekintésének hosszát vagy beszélgetési mélységét.

Ha a Google NotebookLM -et használja, ahol először jelent meg az audio áttekintő funkció, akkor írhat egy promptot, amely diktálhatja, hogy a podcast -beszélgetés mennyire megy. Néhány héttel ezelőtt létrehoztam egy audio podcastot egy 59 futási idővel a NotebookLM -en.

Ikrek nem engedi, hogy ezt megtegye. Még nem.

A Gemini automatikus dokumentumfelismerése a fájlok alkalmazásban. Nadeem Sarwar / digitális trendek

Ezután megvan a nyelvi akadály, mivel a Google jelenleg folyamatban van az egész csővezeték finomhangolása az angol nyelven. Egy másik probléma az anglikált kiejtés volt. Például az AI podcast-házigazda tévesen jelölte meg a perzsa világot, a „RAF-vékony” -ot, mint „RAAF-tin” -t.

Az angol-perzsa fordítás kétnyelvű árnyalatainak képzetlen füléhez vagy annak, hogy az ékezetek hogyan változtatják meg a szavak hallási észlelését más nyelven, az AI podcast-házigazdák nagyon jó hangot adhatnak.

Tapasztalataim összege az, hogy a Gemini audio áttekintése nem forradalom. Csak más, és elterjedtebb médiumot kínálnak a tartalomhoz való kapcsolattartáshoz. Ez nem működik állandóan, de minden bizonnyal a szöveg oldalainak átolvasásának unalmából származik, amely egyébként aludni fog.

Back to top button