Tippek a generatív MI-k kipróbálásához
A mesterséges intelligencia talán legizgalmasabb mai felhasználásai a generatív MI-k (generative AI). A "generatív" azt jelenti, hogy ezek az MI-k képesek arra, hogy egy adott, jellemzően szöveges utasítás alapján különböző dolgokat, például képeket, videókat, szövegeket, hangokat állítsanak elő, azaz generáljanak. Ezt a szöveges utasítást egyébként “prompt”-nak hívják, tehát a prompt, ami “ráveszi” az MI-t, hogy valamit válaszoljon nekünk.
Ezek az MI-ket mi magunk is kipróbálhatjuk. Szinte mindegyikből van ingyenes, ami általában úgy működik, hogy van egy (napi vagy teljes) korlát, hogy mennyit használhatjuk.
Itt van néhány tipp, melyiket érdemes használni.
Képgenerálás
Úgy működnek a képgeneráló MI-k, hogy leírjuk szavakkal, milyen képet szeretnénk látni, milyen stílusban - például anime vagy egy híres festő stílusában. Az MI ezután a leírás alapján létrehoz egy képet számunkra. Manapság ezek a képgenerálók már nagyon élethű képeket alkotnak, sokszor nem is tudjuk megkülönböztetni őket a valóságtól. Sok ilyen weboldal és mobil app is létezik, fizetősek is, de vannak ingyenesen használhatók is bőven. Tehát emiatt ne fizessünk feleslegesen.
Bing Image Creator (ingyenes, Microsoft fiók kell hozzá)
Playground AI (napi 50 kép ingyenes, Gmail fiókkal is lehet regisztrálni)
Gyors kép generálás, regisztráció nélkül:
https://fastsdxl.super-duper.xyz/
vagy ez, ha nem megy már a fenti
https://fal.ai/models/fal-ai/fast-lightning-sdxl/playground
A Bing Image Creator-nak írhatunk magyar nyelven is kérést, de a legtöbb ilyen MI-nél sokkal jobb eredményt kapunk, ha angolul írjuk meg a szöveget. Az angol fordításhoz kérhetünk segítséget pl. a ChatGPT-től (lásd következő rész).
Chatelő / szöveg generálás
Ilyen mesterséges intelligencia pl. a ChatGPT. A ChatGPT és a többi hasonló MI különleges mesterséges intelligenciák, melyeket "nagy nyelvi modellnek" (large language model - LLM) is hívnak. Úgy tanították be ezeket, hogy rengeteg internetes szöveget, könyvet és egyéb írott anyagot mutattak nekik. Miután ezekből tanultak, képessé váltak arra, hogy emberi nyelven, összefüggő mondatokkal válaszoljanak szinte bármilyen kérdésre vagy témára. Olyan mintha egy igazi emberrel beszélgetnénk. Az az érdekes, hogy a kutatók sem egészen értik teljesen, hogyan sikerült ezeknek az MI-nek ennyire jól elsajátítania az emberi nyelveket. Fontos tudatosítani, hogy pl. a ChatGPT továbbra is "csak" egy számítógépes program, bármilyen okosnak és emberszerűnek is tűnik. Fejlett algoritmusok vezérlik, de nincs öntudata, érzései vagy önálló személyisége. A ChatGPT és a többi hasonló MI nem internet kereső (mint a Google), nem weboldalakon keres, hanem az alapján válaszol, amit megtanult. Ez egy nagyon gyakori tévhit ezekkel az MI-kkel kapcsolatban.
Mindenezek után pár ilyen MI, amit ti magatok is ki tudtok próbálni (mindegyiknek van ingyenes változata, és mindegyik elég jól “tud” magyarul is társalogni velünk). Talán a legemberszerűbben a Claude “beszél”, de a többit is érdemes kipróbálni.
Zenegenerálás
Ezeknél meg tudjuk adni, hogy milyen zenét szeretnénk. Akár csak egy cím alapján is képes teljes dalszöveget és zenét alkotni. Bevihetünk általunk írt dalszöveget is. Ezek az MI-k már egész jól boldogulnak a magyar nyelvvel is.
Mindkettőben elég sok zenét lehet ingyenesen generálni, a Suno jobb magyar nyelvű dalszövegekkel. A dalszövegeket egyébként érdemes lehet a ChatGPT-vel vagy a Claude-dal generáltani. Megírjuk a témát, a plusz dolgokat, és abból kérhetünk verset ezektől az MI-ktől.
Videógenerálás
Mindezek után nem meglepő, hogy videót is tudunk generáltatni. Ezek még kezdetlegesebbek, mint a többi generatív MI, mivel egy konzisztens videó létrehozása sokkal több számítási erőforrást igényel. De már most is megdöbbentő, hogy mire képesek.
Sora demo videók (még nem érhető el átlag felhasználók számára)
Hangklónozás / szintetizálás
Egy olyan MI, ami bármely ember hangját utánozni tudja. Valakinek a hangjából mintát veszünk, és utána az MI azon a hangon tud megszólalni. De használják ezt a fajta MI-t arra is, hogy egy tetszőleges virtuális személynek hangot adjanak, vagy egy videó alatt narrátorként használják
Deepfake
Amikor valakiről egy olyan hamis videó vagy hangfelvétel készül, amin valójában nem ő maga szerepel, hanem egy MI által klónozott szereplő, deepfake-nek hívják. Ez egy nagyon veszélyes felhasználása az MI-nek. Az így létrehozott virtuális személy megszólalásig hasonló az eredeti személyhez. Nagyon fontos, hogy ne higgyetek el mindent, amit a videókon vagy képeken láttok. Előfordulhat, hogy rosszindulatú társatok olyan képet vagy videót készít rólatok (vagy barátotokról), amin látszólag ti szerepeltek. Lehet, hogy csak viccből csinálják. De lehet, hogy le akarnak járatni a többiek előtt. Vagy bosszút akarnak állni valamiért. Mindenképpen kérjetek segítséget felnőttől, ha ilyen jellegű zaklatás érne, mert ez is zaklatás. Egy ilyen videó jó heccnek tűnhet, de nagyon nagy lelki sérülést lehet okozni. Sajnos nem egyszer történt tragédia ilyen eset után. Ezekre nem adok tippeket, általában bonyolult a telepítésük és egy erős gamer számítógép kell a futtatásukhoz, erős videókártyával.
Egyéb
Ezeken kívül még léteznek olyan generatív MI modellek, amivel másfajta kimenetet lehet generálni, pl. 3D modellt.
Generatív MI-t használnak részben robotok vezérlésére is, néhány jópofa videó az utóbbi kb. 1 év eredményeiről:
Szintén van olyan MI segéd, ami segít nekünk a programozásban, de csak simán a ChatGPT-vel is tudunk programozni tanulni.
Érdemes nyitva tartani a szemünket, nagyon gyorsan fejlődik az MI, folyamatosan jelennek meg újabb fejlesztések, tudományos áttörések.