Utwór
Daj na zgodę
rapowany głosami Peji i Tedego został wykonany przy pomocy głosowej sztucznej inteligencji. Autor, nasz rozmówca, naśladując style obu raperów, jest jedyną osobą realnie tam występującą. Ale przez nałożenie głosów na swój głos sprawił, że zrobiony dla żartu utwór brzmi całkiem realistycznie.
Ten żart zwiastuje całkiem poważne zmiany w popkulturze.
donald.pl: Czy trzeba się dużo napracować, żeby skleić takie coś jak ty? Bardziej trzeba być fachurą, czy wystarczy mieć fantazję i cierpliwość?
Anon: Zależy czy pytacie o stronę techniczną czy "artystyczną". Technologicznie największą robotę wykonali autorzy kodu, który pozwala na takie triki. Natomiast sporo mocowania jest w związku z tym, że trzeba wiedzieć gdzie szukać tych nowinek, trochę grzebać w kodzie, przygotować dane i tak dalej. To nie są jakieś masakryczne roboczogodziny - szczególnie w porownaniu ze stworzeniem samych możliwości technologicznych do robienia takich cudów. Tekst napisałem w 10 minut, więc nie ma o czym mówić.
donald.pl: Czyli jak jeszcze trochę poczekamy, to za rok będziemy robić takie rzeczy w przeglądarce? I będzie można głosem Kaza Bałagane złożyć koleżance życzenia urodzinowe? Albo jakbyśmy cię poprosili o kawałek, w którym Malik Montana zachwala pokorę, umiar i wyraża szacunek do kobiet, to ile by ci to zajęło?
Anon: Myślę, że do tego czasu wszystkim taki zabieg spowszednieje. Już są narzędzia, które pozwalają laikom nagrać z poziomu przegądarki coś tam głosem Kanye Westa czy Drake'a. Ale myślę, że już za miesiąc to nie będzie na nikim robiło wrażenia.
donald.pl: Czy możesz wyjaśnić laikom czym różni się to co zrobiłeś od połączeń muzycznych, które już znaliśmy? Na przykład blendów albo mash upów?
Anon: Ja blendów nawet nie lubię. Ale sprawa przedstawia się mniej więcej tak, że jest technologia taka jak Voice 2 Voice. Ludzie, którzy w większości zajarali się technologią Voice 2 Voice robią przede wszystkim takie tłumaczenia - typu, że Kanye West śpiewa Barkę. To jest śmieszne, ale też można tego produkować miliony a po drugie autorzy tekstu czy muzyki mogą Ci to zaraz skasować.
Ciekawszym dla mnie mykiem jest robienie nowych numerów (nowe teksty, nowa muzyka) z wykorzystaniem głosów znanych ludzi. I to właśnie ja zrobiłem w moim pierwszym numerze. To jest bliżej wykorzystania tej technologii trochę jak autotune, czy nagrywania dużo lepszych "parodii" znanych osób niż takiego mashupowania czy blendowania.
donald.pl: Czyli to narzędzie do podrabiania i parodii, czy coś więcej?
Anon: Na razie widzę więcej pozytywnych stron. Odchodząc w ogóle od tematu "podrabiania" głosów znanych ludzi (co, tak jak podkreśliłem, wkrótce wszystkim spowszednieje) to taka technologia uwalnia w osobach które potrafią np. pisać, rapować, śpiewać potencjał tworzenia wielu alter ego, niezaleznych projektów które nie muszą być ze sobą wzajemnie powiązane. Kobieta może wydać album rapując męskim głosem i np. osiągnąć sukces na podstawie swoich umiejętności i pomysłowości. W tym widzę największy potencjał. Nie sądzę, że znane głosy będą chciały udostępniać swój voice model tak, by inni mogli swobodnie nagrywac utwory ich głosem, bo byłoby to psucie ich marki czy tam potencjału generowania hajpu do nowych numerów.
donald.pl: Czyje powinny być prawa autorskie w takim wypadku? Kiedy ktoś używa czyjejś barwy głosu jako instrumentu, ale tekst i muzyka są nowe?
Anon: Myślę, że jeśli utwór jest oznaczony jako AI, ale tekst i muzyka są oryginalne, to powinno być to traktowane na zasadzie parodii/komedii lub fair use. Kasowanie tego uważam za małostkowe. Co do tych "prostych" coverów czyli - Drake śpiewa Dodę, to właściciele praw do muzyki i tekstu mają prawo by to kasować, ale tez myślę że to korporacyjna nadgorliwość.
Słucham czasem radia Kampus i na przykład wyłapałem już 3 czy 4 artystów, którzy mają IDENTYCZNY flow i intonację jak Taco Hemingway. Czym się różnią od typa, który nagra głosem Drake'a swój numer - moim zdaniem różnica jest niewielka a ci pierwsi grają na Off Festivalu i są ogólnie uważani za spoko artystów.
donald.pl: Artyści mieli do tej pory wybór: tworzyli co chcieli, albo tworzyli to, czego chce publiczność, albo znajdowali złoty środek. Czy teraz otwiera się era fanów, którzy robią z twórczością artysty to, co chcą? Albo inaczej: czy twórcy nie będą musieli konkurować z twórczością fanów?
Anon: Uważam, że nie będzie żadnej "personalizacji" wydawnictw muzycznych - czytałem opinie, że każdy będzie mógł mieć swoją wersję nowej płyty Taylor Swift dostosowaną do swojego gustu itd. Ludzie potrzebują wspólnych, mocno wyhajpowanych doświadczeń takich jak premiera sezonu Sukcesji czy nowa płyta Maty. Płyt czy seriali są tysiące a jakimś cudem na końcu gada się o kilku - ludzie to lubią.
donald.pl: Tak na margienesie, pytanie od publiczności:
Anon: Poczekam, aż stanowisko wyda Paluch i wtedy się odniosę :)
donald.pl: A co jeżeli takie zabawy jak twoje doprowadzą do tego, że tym bardziej będzie cenione to, co autentyczne?
Anon: Ludzie potrzebują wspólnych doświadczeń kulturowych i muzyczny fan art tego nie zmieni. Natomiast myślę, że ciekawym motywem jest możliwość porównania twórczości fanowskiej z twórczością prawdziwego artysty 1 do 1 i zaobserwowania reakcji ludzi. Po kawałku Drake / The Weekend widać, że jakiś random z neta rapuje przynajmniej tak samo dobrze jak Drake - to dlaczego Drake jest bardzo cenionym (powiedzmy) raperem a ten random nie? No bo jest cała nadbudowa hajpu, wizerunek, wytwórnia itd. Pod moim numerem też zdarzały się komentarze, że zwrotki Tedego są lepsze niż to co on sam aktualnie nagrywa. Ten chwilowy trend uwydatnia rolę wizerunku, backstory, "pozycji na scenie" czyli pozamuzycznych czynników, które wpływają na ocenę np. płyty czy singla.
donald.pl: Mówisz, że ta technologia spowszednieje. W takim razie muzyka zamieni się w jeszcze jeden rodzaj contentu, memu, w którym rządzi pomysł?
Anon: Nie do końca. Technologia transferu głosu która wykorzystałem w moim numerze nie załatwia tematu produkcji całego numeru. To jest efekt na wokalu. Melodię, tekst, beat nadal musi wymyślić człowiek. Oczywiście poszczególne elementy tej układanki mogą być wspierane przez różne narzędzia AI, ale na razie teksty ChatGPT pisze słabe. Więc nie ma opcji, że naciskasz enter a AI generuje ci cały numer z potencjałem na viral - myśle że sporo osób słuchając mojego numeru myśli, że trochę tak to powstało i są w większym szoku niż powinni być.
donald.pl: Ty sam chcesz pozostać anonimowy, ale masz pewne umiejętności i możliwości, które sprawiły, że zrobiłeś taki utwór. Pobaw się i pozgaduj, w jakim procencie potrzebne były umiejętności muzyczne, "programistyczne", kulturalne (wiedza o kontekstach) a na ile kreatywne?
Anon: Myślę, że 60% to umiejętność szybkiego napisania przyzwoitego (jak na warunki współczesnego rapu) tekstu, 20% te konteksty o których mówicie, a skill technologiczny to kolejne 20%.
donald.pl: Miałeś jakiś pomysł, na który nie starczyło jeszcze możliwości? Grechuta na wokalu Slayera? Żabson śpiewający Ave Maria na spółkę z Walaszkiem?
Anon: Tak jak wspomniałem - memiczne "przeróbki" zostawiam innym. Ja raczej planuję wykorzystać technologię do nagrywania numerów, których autorem będę ja. Modeli znanych głosów zrobiłem już sporo - jedne wychodzą lepiej niż inne, ale jest trochę pomysłów - także na krawędzi dobrego smaku, więc nadal waham się, czy je zrobić. Największe wyzwanie technologiczne to dostęp do próbek głosu wysokiej jakości - robione chałupniczo acapelle nie dają fajnych efektów. To duże ograniczenie tej technologii więc w lepszej sytuacji są właściciele głósów, którzy nie wydali oficjalnych acapelli swoich kawałków.
donald.pl: W ogóle wyobrażasz sobie takie "Mam talent", przychodzą ludzie i prezentują takie utwory, które są remiksem głosów, muzyki, kontekstów, mają wygenerowane w AI klipy. A w jury Chylińska albo Wojewódzki oceniają, na ile to jest autentyczne i czy naroddziło się z emocji xD
Anon: Śmiechy, śmiechy, ale ciekaw jestem jak "na ślepo" krytycy czy słuchacze oceniliby numery nagrane przez zdolnych randomów głosem znanego artysty vs. nowe numery nagrane przez tego samego artystę. Mogłoby być ciekawie, a kilka legend mogłoby runąć.