Dzięki sztucznej inteligencji niezadługo każdy będzie mógł tworzyć muzykę. Czeka nas rewolucja w przemyśle muzycznym – mówi PAP kulturoznawca i producent muzyczny dr Stanisław Trzciński, autor książki „Zarażeni dźwiękiem. Rynek muzyczny w czasach sztucznej inteligencji”.
Polska Agencja Prasowa: Jaki wpływ na rynek muzyczny wywiera sztuczna inteligencja?
Dr Stanisław Trzciński: Już co najmniej od dekady sztuczna inteligencja napędza nowoczesną, cyfrową dystrybucję muzyki. Serwisy streamingowe, które obecnie odpowiadają za dystrybucję muzyki, są przecież napędzane przez algorytmy, które śledzą nas – słuchaczy, odbiorców – oraz dobierają nam repertuar, którego większość z nas słucha na co dzień, niewielu z nas jest bowiem aktywnymi pasjonatami, którzy sami wyszukują swój repertuar. Ten rodzaj sztucznej inteligencji odpowiada za to, aby dobierać indywidualną ofertę, ale również, aby sprzedawać nam rzeczy, na których najbardziej zależy sprzedawcom muzyki. Na rynku światowej muzyki liczy się na końcu pieniądz. Sprzedawcom muzyki łatwiej jest "zaatakować" nas tym, co chcieliby sprzedać, mając wiedzę o tym, kto z nas jest na taką muzykę najbardziej otwarty.
Natomiast tym rodzajem sztucznej inteligencji, która budzi duże obawy środowiska artystycznego, jest ta generatywna. To ona tworzy nowe słowa i teksty oraz niesamowite obrazy. Może także tworzyć muzykę. Ludzie z branży muzycznej obawiają się, że część z nich zostanie zastąpiona właśnie przez AI, która sama będzie tworzyła zupełnie nowy repertuar czy wykonania. W swojej książce "Zarażeni dźwiękiem" opisałem dobre strony i szybszą profesjonalizację rynku muzycznego, który otrzyma kolejne, nowe narzędzia. Chcę jednak z całą mocą podkreślić, że w szczytowym momencie, do którego dojdzie najpóźniej w przeciągu kilku lat, każdy z nas po wprowadzeniu do systemu kilku niedużych komend będzie w stanie wygenerować nową muzykę na przyzwoitym poziomie. Jakość takich produkcji będzie zależała od gatunku muzycznego oraz od tego, w jakim tempie systemy neuronowe nauczą się światowego repertuaru.
To duża rewolucja, ponieważ demokratyzacja tworzenia muzyki będzie niezwykła. Każdy z nas – nawet bez wykształcenia muzycznego – będzie tworzył swój własny repertuar, większość dla zabawy, niektórzy również dla pieniędzy. Twórcom chcę jednak przekazać, że nie trzeba się wyłącznie obawiać, najlepiej poznawać te nowe systemy, aby właściwie wykorzystać ich niezwykłe możliwości.
PAP: Czy sztuczna inteligencja przyniesie kres epoki wielkich producentów muzycznych?
Dr S. Trzciński: Rzeczywiście wielcy i szanowani producenci odpowiedzialni są za brzmienie The Beatles i U2, a na polskim gruncie na przykład za płyty Edyty Bartosiewicz czy obecnie Dawida Podsiadło. To byli – i po części nadal są – bardzo dobrze wykształceni i zdolni ludzie. Jednak już od kilkunastu lat mamy do czynienia z wysypem bardzo młodych producentów, tzw. zdolnych dzieciaków. Nie mają oni wykształcenia muzycznego, ale korzystają z oprogramowania, które pozwala im na wykorzystanie niezliczonej liczby różnego typu sampli, czyli cyfrowo zapisanych fraz muzycznych.
Dzisiaj bardzo wiele gwiazd – również z polskiej estrady – korzysta z producentów, którzy nie są wykształconymi muzycznie mistrzami, tylko po prostu są ludźmi z pasją, oraz którzy mają wyczucie i bawią się tymi programami do produkcji. Coraz więcej korzysta z tych programów i nie będąc muzykami czy wielkimi mistrzami po studiach z produkcji, masteringu czy realizacji dźwiękowej, są w stanie wyprodukować wielkie przeboje. Jest duża szansa, że niezadługo – właśnie dzięki sztucznej inteligencji – każdy z nas będzie mógł być takim producentem. Demokratyzacja produkcji muzycznej zejdzie do poziomu zwykłego, szarego człowieka – fana danej muzyki.
PAP: Powiedział pan, że tak jak na podstawie komend można już tworzyć teksty i obrazy, tak też będzie można tworzyć muzykę. Czy rynek muzyczny – w porównaniu z tym tekstowym czy obrazowym – coś jednak odróżnia?
Dr S. Trzciński: Faktycznie rynek muzyczny odróżniają kwestie praw autorskich oraz tego, że nieco trudniej jest zasysać dane po cichu. Sztuczna inteligencja uczy się bowiem ze wszystkich obrazów na świecie, jakie zasysa, zaś czat tekstowy uczy się z tego, co mamy w różnych wyszukiwarkach i bazach na całym świecie. Kiedy jednak wprowadzimy komendę, że chcemy utwór a’la Jimi Hendrix, z wokalem a’la Prince oraz linią melodyczną czy gitarą stylizowaną na jeszcze kogoś innego, to prawnicy reprezentujący firmy czy katalogi tych artystów będą w stanie udowodnić tym serwisom to, że zasysały nie swój repertuar.
Wciąż toczą się wielkie dyskusje i batalie między BigTechami, które posiadają lub skupują serwisy i laboratoria napędzane sztuczną inteligencją, a globalnymi wytwórniami muzycznymi, tzw. majors, i największymi publishingami zarządzającymi większością światowych praw autorskich. Tak jak powiedziałem, sztuczna inteligencja uczy się na bazie danych. Wszystkie te systemy uczą się na danej liczbie piosenek czy w ogóle repertuaru, zazwyczaj są to dziesiątki tysięcy utworów. W momencie, kiedy bariera prawna zostanie w jakiś sposób uzgodniona między stornami, te systemy będą się uczyły już na milionach utworów. Wówczas będą one coraz lepsze i owoce ich działania będą zbliżone do produkcji prawdziwych, żywych muzyków.
PAP: Czeka nas zatem duża zmiana w przemyśle muzycznym…
Dr S. Trzciński: To będzie naprawdę rewolucja! Szczególnie w przypadku muzyki elektronicznej, klubowej i komercyjnej w przestrzeniach publicznych, takich jak sklepy czy restauracje. Nadal nie jesteśmy jednak w stanie przewidzieć większości zastosowań tej wielkiej zmiany. Ktoś kiedyś ładnie powiedział, że wynalazca suszarki do włosów na etapie wynalezienia prądu nie wiedział, że wymyśli suszarkę.
Niektóre zastosowania można sobie jednak próbować wyobrazić. W swojej książce opisałem ukończenie niedokończonych kompozycji Franza Schuberta i Gustava Mahlera oraz X Symfonii Ludwiga van Beethovena, które nie zostały przez swoich kompozytorów dokończone za ich życia. Sztuczna inteligencja, choć z pomocą muzykologów i innych kompozytorów, na podstawie danych, które od nich otrzymała, wczuła się we wspomnianych przeze mnie kompozytorów. Opisałem również stworzony na nowo repertuar zagrany w stylu Jimi’ego Hendrixa, to były zupełnie nowe utwory! Na pewno pojawi się wiele nowych płyt nieżyjących artystów. Brzmi to nieco przerażająco, ale jest jednocześnie dosyć interesujące i dla wielu będzie atrakcyjne.
PAP: Czy sztuczna inteligencja może również wykreować wirtualnych artystów?
Dr S. Trzciński: Oczywiście! Powiem jednak więcej, nie jest to kwestia przyszłości, ale dzieje się to już teraz. W swojej książce opisuję to zjawisko, które jest coraz bardziej powszechne w Azji, pojawia się również w Stanach Zjednoczonych. Są już bowiem artyści całkowicie wirtualni, którzy nie istnieją w świcie realnym, a którzy są popularnymi gwiazdami. Tworzone są dla nich wokale, komponowane całe utwory. Wykonawcy mają swoje awatary, codzienne aktualizowane profile w mediach społecznościowych, a ich przeboje notują po kilka milionów odtworzeń. Takich postaci wirtualnych gwiazd jest już trochę na świcie.
Podaję też w książce inny przykład. Jeden z uznanych artystów K-Popu – artysta jak najbardziej żywy, istniejący naprawdę – jednego dnia wypuścił od razu w kilkunastu językach swój nowy utwór. Sztuczna inteligencja pozwala również na to, aby w oparciu o głos żyjącej gwiazdy, która nie zna języków obcych, wyprodukować i od razu opublikować zaśpiewany przez nią utwór w kilkunastu wersjach językowych.
PAP: Czy utwory skomponowane przez człowieka oraz te stworzone przez sztuczną inteligencję będą możliwe do odróżnienia?
Dr S. Trzciński: Są już prowadzone badania nad tym, czy trudno będzie odróżnić repertuary stworzone przez człowieka i przez AI. Wiele zależy od tego, w jakiej kategorii muzycznej one powstały. Wiele z nich było nie do rozróżnienia dla fanów. Tym bardziej nie dziwię się, że w Parlamencie Europejskim i Kongresie Stanów Zjednoczonych trwają prace legislacyjne, które przewidują między innymi obowiązkowe oznaczanie treści wytworzonych z udziałem systemów AI.
Rozmawiałem z osobami, które siedzą w branży związanej ze sztuczną inteligencją. Są one jednak przekonane o tym, że talent i geniusz, a także ludzka kreatywność wciąż będą najważniejsze. Często jako przykład dla tej tezy wskazuje się telefony komórkowe. Kiedyś fotografią zajmowali się przede wszystkim ludzie utalentowani, trzeba było kupić drogi sprzęt, umieć robić zdjęcia i je wywoływać, było to kosztowne. W tej chwili każdy z nas, mając smartfona, jest fotografem, robi tysiące zdjęć. A jednak zawód profesjonalnego fotografa czy reportażysty wciąż istnieje. Tak też zadzieje się na rynku muzycznym. Mimo że każdy z nas będzie mógł coś sam wyprodukować, nadal będziemy zasłuchani w ludziach utalentowanych, wywołujących emocje, a tym bardziej w mistrzach i wirtuozach.
Rozmawiała Anna Kruszyńska (PAP)
Książka "Zarażeni dźwiękiem. Rynek muzyczny w czasach sztucznej inteligencji" została wydana nakładem Wydawnictwa Naukowego PWN.
Autorka: Anna Kruszyńska
akr/ skp/