A mesterséges intelligencia használata a zenei világban: A kreativitás új dimenziói

július 4, 2024

Az új technológiák korában a mesterséges intelligencia használata (MI) már nemcsak a hétköznapi tevékenységeinket segíti, hanem a művészeti alkotások területén is egyre nagyobb szerepet kap. Oliver Bown, az Új-dél-walesi Egyetem kutatója szerint ma már nem technikai kérdés, hogy az MI képes-e érzelmek nélkül zenei alkotásokat létrehozni, hanem inkább társadalmi és kulturális kontextusban kell értelmezni ezt a képességét:

„Az a nézet, hogy az MI-rendszerek sosem lesznek képesek olyan valódi zenét előállítani, mint az emberek, immár sokkal inkább társadalmi kontextusban értelmezhető, semmint a technikai képességek terén” fogalmazta meg a The Conversation oldalán megjelent cikkében.

A Suno és az Udio, két új alkalmazás megjelenése óriási változásokat hozott a zene világába. Ezek az alkalmazások képesek egyszerű szöveges leírások alapján nem csak szöveget generálni, hanem azt zenei kompozíciókba is átültetni. Milyen eredményekkel? Dalok, amelyek olyan minőségűek, hogy az ember azt hihetné, valódi előadók éneklik őket. Bown szerint ez azt bizonyítja, hogy az MI képes arra, hogy érzelmek nélkül is kifejező, emberi hangzású zenét hozzon létre:

„A hatás pedig elképesztő lehet. Tudatában vagyok, hogy ez csak mesterséges intelligencia, de az ének így is képes érzelmi hatást kifejteni. Amikor a dal egy tökéletesen kivitelezett ütemvégi piruettel lép be egy új szekcióba, az agyamban éppen olyan apró szikrákat gyújt a mintafeldolgozás öröme, mintha csak egy nagyszerű bandát hallgatnék” 

Azonban ez a technológia nemcsak lehetőségeket, hanem kihívásokat is rejt. A zeneiparban dolgozók között vita alakult ki arról, hogy az MI által készített zenék milyen hatással lesznek a hagyományos zeneszerzésre. Egyesek szerint ezek az új eszközök demokratizálják a zenei alkotás folyamatát, lehetővé téve bárki számára, hogy saját ötleteit megvalósítsa. Mások viszont aggódnak amiatt, hogy az MI által generált zenék veszélyeztethetik a zenei szerzők jogait és kreatív szabadságát. A Suno és az Udio példája rámutat arra is, hogy a generatív MI rendszerek milyen mértékben támaszkodnak a meglévő zenei művekre. Bár ez a tanulási folyamat segíti az MI fejlődését, számos jogi és etikai kérdést is felvet. Hogyan kezeljük azokat a helyzeteket, amikor az MI által generált zenék túlságosan hasonlítanak a már létező művekre? Hogyan biztosítható, hogy az alkotók megkapják a nekik járó elismerést és juttatásokat?

Nézzük meg együtt milyen kihívások elé állítja a zene szakmai területén!

Az AI és a Zene: Új Kihívások a Horizonton

Idén év elején Bad Bunny határozottan cáfolta azokat a pletykákat, miszerint egy új dalon dolgozik Justin Bieberrel, hamisnak nevezve a híreszteléseket. Ennek ellenére egy dal, amelyben az ő és Bieber hangja hallható, elkezdett terjedni a TikTokon, és gyorsan emberek milliói kedvelték. Bad Bunny nem hazudott; a dalt mesterséges intelligenciával (MI) hozták létre. Egy FlowGPT nevű művész MI technológiát használva reprodukálta Bad Bunny, Bieber és Daddy Yankee hangját egy reggaeton himnuszban. Bad Bunny nem volt lenyűgözve, elrettentette rajongóit a hallgatástól, ami a dal TikTokról való eltávolításához vezetett. Ugyanakkor sok rajongó imádta, ami jól mutatja az MI zeneiparra gyakorolt összetett és vitatott hatását.

Az elmúlt néhány évben a gépi tanulás fejlődése lehetővé tette az emberek számára, hogy otthonukból reprodukálják zenei kedvencük hangját. A Ghostwriter például azzal vált híressé, hogy utánozta Drake és The Weeknd hangját, míg egy másik alkotó humorosan Frank Sinatra hangját használta Lil Jon profán szövegeivel. Az MI eszközök még arra is képesek, hogy felhasználók által beírt utasítások alapján dalokat generáljanak, hasonlóan a szöveg-kép eszközökhöz, mint például a DALL-E.

A támogatók szerint ezek a fejlesztések demokratizálják a zenét, lehetővé téve bárki számára, hogy a hálószobájából alkosson. Azonban a művészek aggódnak, hogy hangjukat és stílusukat mások saját hasznukra kisajátítják és árucikké teszik. Az ellentét a művészek védelme, az innováció ösztönzése és az emberek és gépek zenei alkotásban betöltött szerepének meghatározása között még évekig fennmarad. Lex Dromgoole zenész és MI-technológus jelentős kérdéseket vet fel: „Ha hatalmas mennyiségben és sebességgel keletkezik zene, vajon visszatérünk-e ahhoz, hogy elgondolkodjunk azon, mit is teszünk hozzá emberként? Hol van az emberi  alkotóképesség? Hogyan adjunk karaktert saját alkotásainknak?”

Az MI már most is alapvető szerepet játszik a zenei produkcióban, segítve a hangmagasság korrekcióját és lehetővé téve a mérnökök számára, hogy gyorsabban és olcsóbban keverjék és mastereljék a felvételeket. A Beatles például MI segítségével izolálta John Lennon hangját egy 1978-as demóból, új, kifogástalan minőségű dalt létrehozva. Az MI algoritmusok szintén elengedhetetlenek a streaming platformok, mint a Spotify és az Apple Music számára, amelyek hallgatási szokások alapján ajánlanak dalokat. 

Az MI általi zenealkotás azonban vegyes érzelmeket váltott ki. A zenészek üdvözölték az olyan eszközöket, mint a BandLab, amely egyedi zenei loopokat javasol írói blokk esetén. Az Endel MI alkalmazás személyre szabott, folyamatosan változó hangzásokat generál a koncentrációhoz, pihenéshez vagy alváshoz, a felhasználói preferenciák és biometrikus adatok alapján. Más MI eszközök teljes felvételeket hoznak létre szöveges utasítások alapján. Például egy új YouTube eszköz, amelyet a Google DeepMind nagy nyelvi modellje, a Lyria működtet, képes generálni egy dalrészletet olyan utasítások alapján.

Ezek a technológiák számos aggályt vetnek fel. Ha egy MI azonnal képes „Charlie Puth dalt” létrehozni, mit jelent ez Charlie Puth számára vagy más feltörekvő zenészek számára, akik félnek a helyettesítéstől? Engedélyezni kell-e az MI cégeknek, hogy a modelleiket dalokon képezzék ki a készítők engedélye nélkül? Az MI-k már most is használatosak az elhunytak hangjának feltámasztására, ahogy az új Edith Piaf életrajzi film is tartalmaz egy MI által létrehozott verzióját a hangjának. Hogyan változik az emlékezés és az örökség megértése, ha bármely történelemből származó hangot újraéleszthetünk?

Még az MI lelkes hívei is aggodalmukat fejezték ki. Edward Newton-Rex, a Stability AI volt alelnöke lemondott a cégnél, attól tartva, hogy hozzájárul a zenészek állásainak elvesztéséhez. Kritikát fogalmazott meg azokkal a cégekkel szemben, amelyek az alkotók munkáit engedély nélkül használják fel generatív MI modelljeik képzéséhez, új tartalmat hozva létre, amely az eredeti művekkel versenyez.

Nyílt levél a művészektől

A nyílt levél több mint 200 olyan neves művésztől érkezett közöttük mint: Stevie Wonder, Miranda Lambert, Billie Eilish, Nicki Minaj, Peter Frampton, Katy Perry, Smokey Robinson és J Balvin. A levélben mindannyian elismerik az új MI-technológia kreatív lehetőségeit, és felszólítja a mesterséges intelligencia technológiai vállalatait, fejlesztőit, platformjait, digitális zenei szolgáltatásait és platformjait, hogy hagyjanak fel az AI használatával.  

"Az emberi kreativitás elleni támadást meg kell állítani" – olvasható a levélben. "Meg kell védenünk a mesterséges intelligencia ragadozó felhasználását, amely ellopja a hivatásos művészek hangját és képmását, megsérti az alkotók jogait és elpusztítja a zenei ökoszisztémát." A levél itt érhető el.

Az AI és a Zene: Új Kihívások

Ezeket a kérdéseket valószínűleg a bíróságok fogják eldönteni az elkövetkező években. Októberben az Universal Music Group és más nagy kiadók pert indítottak az Anthropic startup ellen, amelynek MI modellje, a Claude 2, szó szerint reprodukálta a szerzői joggal védett dalszövegeket. Egy Sony Music vezetője a Kongresszusnak elmondta, hogy a cég közel 10 000 eltávolítási kérelmet nyújtott be az engedély nélküli hangmélyfake-ek miatt. Sok művész, például Dolly Parton, teljesen ki akar szállni, és „a fenevad jelének” nevezte az MI hangklónokat. Ezzel szemben az MI cégek azt állítják, hogy a szerzői joggal védett dalok felhasználása „fair use” alá tartozik, és inkább tisztelgések, paródiák vagy feldolgozások.

A zeneipar hivatalosan is hadat üzent az olyan MI zene generátoroknak, mint a Suno és az Udio, hatalmas szerzői jogi jogsértéssel vádolva őket. Az Universal Music Group, a Warner Music Group és a Sony Music Group által indított perek munkánként akár 150 000 dollár kártérítést követelnek. A Suno és az Udio azonban azzal érvelnek, hogy technológiájuk transzformatív és új tartalmakat generál, nem pedig meglévő tartalmakat másol. Az MI zenéről szóló vita egy szélesebb kérdést vet fel: az MI és az emberi alkotók közötti fenntartható kapcsolat szükségességét. A licencelés lehet az egyetlen megoldás.

Míg a zeneiparnak kihívást jelent jelenleg a mesterséges intelligencia használata, addig más területeken új lehetőségeket ígér: Mesterséges Intelligencia: Várakozások és Valóság - AI Bridge

A mesterséges intelligencia tudatos használata

Holly Herndon, énekes-dalszerző a fentiekkel ellentétben, proaktívan és tudatosan  foglalkozik ezekkel a változásokkal. 2021-ben létrehozott egy hangmélyfake-et saját hangjáról, Holly+ néven, lehetővé téve bárki számára, hogy hangját az övére alakítsa. Projektjének célja nem az, hogy más művészeket is arra kényszerítsen, hogy lemondjanak hangjukról, hanem hogy ösztönözze őket, hogy aktív szerepet vállaljanak ezekben a beszélgetésekben, és autonómiát követeljenek egy egyre inkább tech óriások által uralt zeneiparban. Az énekes azt vallja: "Van mód arra, hogy továbbra is legyen némi önrendelkezésed önmagad digitális változata felett, de légy játékosabb és kevésbé büntető."

Összességében

Akárcsak más generatív-MI-rendszerek, a Suno és az Udio is valódi emberek által létrehozott zenei művek sokaságát elemezve tanult, ami persze sok vita alapja a szellemi jogok kapcsán. Ezzel együtt ez a két alkalmazás jelölheti a mainstrem MI zenei kultúra hajnalát. Olyan újfajta zenei élményt kínálnak, amelyet az emberek felfedezhetnek, amellyel szórakoztathatják magukat, illetve amelyet akár élvezettel hallgathatnak. 

A technológia Bown szerint nem művészeknek készült, hanem a zeneszerető közönségnek. Régóta ismert jelenség ugyanis a kreatív technológiák kapcsán, hogy ahogy valamit egyre könnyebben és olcsóbban lehet előállítani, egyre hétköznapibb érzelmek kifejezésére szolgál. Így aztán a kezdetben magasművészetnek számító médiumok is lassanként hétköznapivá válnak, ahogy azt például az okostelefonok elterjedésével a fotográfia kapcsán megtapasztalhattuk. Képzeljük csak el, milyen lenne valamelyik barátunkat, családtagunkat a születésnapján egy kifejezetten róla szóló dallal meglepni, amelyet minimális költséggel és erőfeszítéssel létre tudtunk hozni – nos, éppen ezt kínálja most az MI.

Természetesen ennek a technológiának is akadnak korlátai. Noha az Udio úgy hirdeti magát, hogy a segítségével „bárki egy dallammal, némi dalszöveggel, vagy egy vicces ötlettel kifejezheti magát a zenében”, Bown szerint ez nem teljesen igaz. Egy rövid szöveges parancs önmagában nem elég precíz instrukció valaminek a létrehozásához, pláne, ha zenéről van szó. Inkább csak arról van szó, hogy vakon tapogatózunk, de nincs érdemi kontrollunk a készülő dalok felett. 

Művészi önkifejezésre tehát nem alkalmasak ezek a rendszerek a szakember szerint, és a felhasználók nem is válnak zeneszerzővé a használatukkal, hanem megmaradnak egyszerű zenefogyasztóknak. Ezzel együtt a generatív zene szerinte éppúgy megoszthatja majd a figyelmünket a zenei kultúra ma ismert formáival, ahogyan azt a hangfelvételek tették annak idején az élő zenével szemben.

Végül, bár az MI képes arra, hogy kreatív folyamatokban részt vegyen, Bown hangsúlyozza, hogy ezek a rendszerek mégsem helyettesíthetik teljes mértékben az emberi kreativitást. Az alkotói folyamatokban való részvétel nem csupán a végeredmény előállításáról szól, hanem magáról az alkotói folyamatról is, amely során az emberek kifejezik érzelmeiket és gondolataikat.

Az AI szabályozással kapcsolatban, egy korábbi cikkünkben is olvashatnak: Az EU és a ChatGPT: Az Adatvédelem Új Korszaka - Mynds.ai

Források:

https://time.com/6340294/ai-transform-music-2023

Az amerikai lemezkiadók beperelik a Suno és az Udio AI zenegenerátorokat szerzői jogok megsértése miatt | VEZETÉKES (wired.com)

AI can now generate entire songs on demand. What does this mean for music as we know it? (theconversation.com)

Miranda Lambert, Billie Eilish, Nicki Minaj sign letter to AI developers to honor artists' rights (nbcnews.com)

U.S. record labels are suing AI music generators, alleging copyright infringement (nbcnews.com)

Image by Hanna Vel from Pixabay

Kérdése van? Keressen bátran!

Legutóbbi bejegyzések:

július 12, 2024
Megjelent a világ első AI rendelete az Európai Unió Hivatalos Lapjában

2024. július 12-én megjelent az Európai Unió Hivatalos Lapjában az AI Act, azaz a mesterséges intelligenciáról szóló rendelet. A Mynds.ai oldalán megjelent a cikk bemutatja a szabályozás hatályba lépésének időpontját, a fokozatos átmeneti időszakokat, valamint a különböző kockázati szintekhez igazodó rendelkezéseket. Olvassa el az összefoglalót, hogy megismerje az AI Act legfontosabb mérföldköveit és határidőit! Kép: […]

Bővebben
július 4, 2024
A mesterséges intelligencia használata a zenei világban: A kreativitás új dimenziói

A mesterséges intelligencia használata a zeneiparban sem egyszerű kérdés. Átnéztük a legfrissebb információkat és összegeztük számodra, hogy…

Bővebben
június 24, 2024
Ilya Sutskever útja az OpenAI-tól a Biztonságos Szuperintelligencia Alapításáig

A mai blogcikkünkben a mesterséges intelligenciával kapcsolatos két fontos eseményéről olvashatnak, amelyek az OpenAI szervezetet érintik. Elsőként azonban fontos említést tenni az ezt megelőző történésekről is. A mesterséges intelligencia (MI) világában kevés történet volt olyan drámai, mint az OpenAI felemelkedése és közelmúltbeli válsága. A középpontban Ilya Sutskever áll, aki a MI startup társalapítója és egykori […]

Bővebben
AI Bridge | MINDEN JOG FENNTARTVA |
ADATVÉDELMI TÁJÉKOZTATÓ
|
IMPRESSZUM