ДепартаментМузика

НАЦИОНАЛНА КОНФЕРЕНЦИЯ “ФЕМА-АКУСТИКА” 2018 ДОКЛАД НА ТЕМА Музиката и изкуствения интелект ГЛ. АС. Д-Р СТЕЛА АТАНАСОВА

НАЦИОНАЛНА КОНФЕРЕНЦИЯ “ФЕМА-АКУСТИКА” 2018 ДОКЛАД НА ТЕМА Музиката и изкуствения интелект ГЛ. АС. Д-Р СТЕЛА АТАНАСОВА

Научни и учебни издания

НАЦИОНАЛНА КОНФЕРЕНЦИЯ “ФЕМА-АКУСТИКА” 2018

 

Доклад на тема

Музиката и изкуствения интелект

гл. ас. д-р Стела Атанасова

 

         Музиката изразява звука на чувствата. Механичната музика изразява правила и ги облича в инструменти. Но човешката мисъл, гений и емоции са причината музиката да е магията, която ни спасява и вдъхновява всеки един ден.

         Следвайки традицията да пиша за развитието на музиката в областта на компютърните технологии, съвсем логично стигнах до дебрите на област, която е много актуална в момента, а именно все по-голямото присъствие и влияние на изкуствения интелект в музиката. На тази тема ме доведе едно интересно явление, което наблюдавам от няколко месеца насам върху най-популярните стилове и песни, които се слушат от масовата публика. Може би водена от желанието да разбера кое кара хората да слушат многократно дадена песен, която дори не харесват, ме доведе до мисълта, че автоматизираното правене на музика се превърна не просто в метод, а в начин на мислене. С всяка година се изумявам колко бързо навлизат похватите на изкуствения интелект в правенето на музика. Но те няма да се ограничат само с правенето на музика. Те ще влязат в нашите профили, в нашите умове и ще започнат да контролират вкусовете и предпочитанията ни. Ще  започнат да променят начина ни на мислене и ще ни накарат да харесваме и възприемаме изкуството, по начини, по които те го създават. Като роботи.

         Не само ще слушаме такава музика. Ние ще имаме нужда от нея, защото това ново течение в музиката, ще се превърне в основен алгоритъм, по който нашите мозъци ще започнат да обработват информацията. И всичко различно от това, ще бъде считано за неудачно.

         Винаги е имало битки между традиционалистите и новаторите в изкуството. Винаги някой се е страхувал да не загуби нещо. Винаги истината е била някъде по средата. Не можем да зачеркнем или забравим миналото, за да живеем в бъдещето. Винаги трябва да има място както за класическото, така и за новото. Затова съм убедена, че и този етап, в който някои композитори използват изкуствения интелект, за да създават музика, ще достигне своя апогей и ще се завърне в добре познатото пространство на човешкия гений.

         Дали компютрите ще изместят човешката душа, креативност, мислене и емоции? Дали те ще са новите композитори на 21 век? Или предстои тежък преход за тези, които се противопоставят както на старото, така и на новото?

         Истината е че в днешно време всичко, което ни заобикаля и владее съзнанието ни чрез телефоните ни, компютрите ни, таблетите ни, се контролира от алгоритми. Именно благодарение на тези алгоритми определени платформи се базират на нашите търсения и харесвания и ни предлагат сходни по интереси теми, изпълнители, продукти. Ние се възползваме от тези автоматизирани услуги, но се страхуваме, когато ни кажат, че може да дойде ден, в който човешкият фактор да е заменен с алгоритъм. Странно е да се страхуваме от алгоритмите, щом стане въпрос и за музиката. Засега няма такава опасност, защото би било в противовес на заложената в човека програма за самозащита. Ако позволи на един алгоритъм да имитира и възпроизвежда емоциите  му, то той би стартирал програма за собственото си унищожение.

         Но все по-често ми правят впечатление коментарите на хора, които определят дадена песен, като генеративна (generative), т.е. генерирана от автоматизиран/автономен процес или система. Много често чувам реплики, в които определят ритъмът, китарните рифове или мелодията в дадена песен, като генеративни, а именно създадени и генерирани от софтуер. При такава система е налице повтаряемост на определен модел, образец, който наподобява именно музиката, създадена на базата на алгоритми. И това е нещо, което ще чуваме все по-често. Не само в коментари. Ще ни се предлага все повече подобна музика и в един момент, неминуемо ще свикнем с нея и дори ще започнем да я харесваме.

         В такъв момент няма как да не си задам логичния въпрос - ще станем ли последователи и фенове на изкуствения интелект? Ще предпочетем ли музиката, създадена от изкуствен интелект пред тази, създадена от човек? И къде е границата между тези два свята, която по-добре да не прекрачваме. Едно е да знаеш, че алгоритъмът следва строго определени правила и създава константни модели, друго е той да започне да мисли като теб и да започне да ти влияе и определя възприятията ти, вкусовете ти и емоциите ти за всичко, което те заобикаля.

         Използването на AI като инструмент за правене на музика или подпомагане на музиканти се прилага от доста време. През 90-те години Дейвид Бауи помага да се разработи приложение, наречено "Вербазизер", което извлича литературен изходен материал и произволно пренарежда думите, за да създаде нови комбинации, които могат да се използват като текстове.

         През 2016 г. учените от Sony използват софтуер, наречен Flow Machines, за да създадат мелодия в стил "Бийтълс". След това материалът се предава на композитора Беноа Каре (Benoît Carré) и се превръща в изцяло произведена поп песен, наречена "Daddy's Car." (Flow Machines се използва и за създаване на музика на цял албум под името SKYGGE).

 

https://www.youtube.com/watch?v=LSHZ_b05W7o

Daddy's Car: a song composed by Artificial Intelligence - in the style of the Beatles

 

 

         Сега има цяла индустрия, изградена около услугите на AI за създаване на музика, включително гореспоменатите Flow Machines, IBM Watson Beat, NSynth Super на Google Magenta, Jukedeck, Melodrive, Лабораторията за изследване на технологиите за създаване на Spotify и Amper Music.

         Повечето от тези системи работят чрез използване на дълбоки учебни мрежи - вид изкуствен интелект, който е зависим от анализа на големи количества данни. По принцип, софтуерът е захранен с тонове изходен материал, от танцови хитове до рок музика, които след това анализира, за да открие желания модел. В него се вписват неща като акорди, темпо, дължина, като тези данни се учат от целия вход, за да могат да пишат свои собствени мелодии. Има разлики между платформите: някои доставят MIDI, а други - аудио. Някои се научават чисто, като разглеждат данни, докато други разчитат на твърди кодирани правила, базирани на музикалната теория, за да ориентират продукцията си.

         Те обаче имат едно общо нещо: в микро-мащаб музиката е убедителна, но колкото по-дълго я слушате, толкова по-малко чувство Ви доставя. Нито един от тези системи не е достатъчно добра, за да изработи песен, достойна да спечели “Грами”. Или поне не засега.

         Тук е мястото да спомена името на една съвременна певица, композитор, продуцент и телевизионна водеща Тарин Сутърн. През 2017 г. Тарин започва работа върху нейния албум, наречен “I AM AI”, където инструменталната част е генерирана изцяло от програмата Amper - open source продукт, който позволява на потребителите да създават музика базирайки се на потребителски генерирани  входове (user generated inputs). Amper е AI музикален композитор и продуцент.

Сутърн реализира първия сингъл от албума I AM AI, наречен “Break Free” през август 2017 г.

 

https://www.youtube.com/watch?v=XUs6CznN8pw

 

         Инструменталът в тази песен е композиран изцяло със средствата на изкуствения интелект. Текстът и мелодията на вокала са написани от Сутърн. При творческия процес, който се състои в предоставянето на информация, като дължина на песента, темпо и тоналност, Сутърн позволява на софтуера действително да композира и продуцира за нея, преди да подреди различните части и да създаде структурирана песен. Дебютът й е приветстван като "първият албум, който е направен изцяло с софтуер за AI”.

         Amper, от друга страна, има интерфейс, който е абсурдно прост. Всичко, което трябва да направите, е да отидете на уебсайта и да изберете жанра музика и настроение. Това е. Не е нужно да знаете код или композиция или дори музикална теория, за да направите песен с нея. Amper изгражда песни от предварително записани проби и създава реално аудио, а не MIDI. От там може да се промени темпото, тоналността; да се заглуши отделен инструмент или да се изключат цели комплекти инструменти, за да се промени настроението на песента, която е направена. Това аудио може да се експортира като цяло или като отделни слоеве от инструменти (известни като тракове). Траковете могат да бъдат допълнително манипулирани в DAWs като Ableton или Logic.

         "Използвайки AI, пиша текстовете и моите вокални мелодии към истинската музика и използвам това като източник на вдъхновение", казва Сутърн. "Намирам това за наистина забавно и защото съм в състояние да повтарям музиката и да й давам обратна връзка и параметри и да редактирам толкова пъти, колкото ми трябва, все още ми се струва, че е моя смисъл.” За да превърне този процес в поп песен, Сутърн прави много творчески решения, включително превключва инструменти, променя тоналността и разбира се, записва и изпълнява вокалите.

         Сутърн се обръща към AI, защото, макар че е текстописец, тя има много малки познания в областта за музикалната теория". "Ще намеря красив акорд на пианото", казва тя, "и бих написал цяла песен около него, но преди това не можех да стигна до следващите няколко акорди, защото просто не знаех как да го направя и как да запиша това, което чувах в главата си. Сега мога да повтарям с музиката и да й дам отзиви и параметри и да редактирам колкото пъти ми е нужно. Все още чувствам, че това е мое в известен смисъл. "

 

Революционна технология?

 

         Колкото и вълнуващо да звучи, някои алгоритмични експерти по композиране са по-малко впечатлени от нейната песен и новаторство. "Хората експериментират с компютърно генерирана музика от Push Button Bertha[1] през 1956 г.", казва д-р Ник Колинс, автор на редица книги за компютърно генерирана музика и съосновател на Chord Punch, независим лейбъл, който пуска алгоритъм базирани работи.  Това не е първия AI албум.[7]

         Push Button Bertha e експеримент на Клайн (Klein) и Болито (Bolitho). Двамата изследователи разработват програма, която позволява на компютъра да генерира произволни числа и тяхното последващо приемане или отхвърляне. Операцията се извършва в съответствие с набор от правила, написани за нуждите на компютрите, като аритметични операции.

         Изразени в музикални термини, всяко генерирано число съответства на една от седемте ноти от диатонична скала, като се позволява да се използват както плавни, така и резки промени. Предписана е група от 6 правила.

         6-те правила са дефинирани при предишен анализ на песни, взети от поп и класическия репертоар. Те взимат под внимание американската Топ10 през 1956 г., за да получат първите три правила:

 

  1. В едно парче поп музика могат да бъдат намерени от 35 до 60 различни тонове;
  2. Всяка песен има структура от тип AABA, където А може да съдържа от 18 до 25 тона за общо 8 такта, докато В, в същата дължина, съдържа от 17 до 35;
  3. Ако 5 последователни тонове се движат в една и съща посока, шестият ход е в обратната посока.

Първата група от три правила се обединява с три други, произтичащи от анализ на произведенията на Моцарт:

  1. Забраната за скокове на интервал не по-голям от секста;
  2. Първият тон от раздел А обикновено не съответства на втория, четвъртия и петия;
  3. Тонове, понижени с бемол, са последвани от други тон надолу, а тези с променени с диез, с тон над.

         След като разполага с дефинирана система от правила, компютърът успява да направи избор на тонове, които да бъдат проверени, като използва таблицата с предварително зададени правила. Като краен резултат от тази система е Push Button Bertha (песен в стил Tin Pan Alley), чието заглавие се отнася до бутоните на компютъра Bertha, името, дадено на Datatron, използвано за експериментиране.

         Но какъв е резултатът? Като експеримент, завършен, за да получите резултат в обикновена музикална нотация, можете да опитате да го възпроизведете на клавиатура или пиано, за да оцените мелодичния добив. Или можете да опитате да препишете оригиналния резултат в MuseScore и след това да го превърнете като аудио файл. Докато слушате, ще разберете, че разполагате с обикновена песен с хубава мелодия. Като цяло хубав резултат и със сигурност много по-добър от много предполагаеми човешки композитори. Ясно е, че това, което има значение в този случай, не е толкова крайният резултат, а първо идеята за създаване на музика чрез компютър, много невероятен факт, когато се гледа през очите на човек от петдесетте години.

         Звуковият артист и продуцентът Брайън Ено, който сътрудничи с хора като Дейвид Бауи и Дейвид Бърн, преди да наблегне на термина "генеративна музика", също работи с алгоритмична и AI технология от деветдесетте години насам.

        

Страх от прекъсване

 

         Подобно на много революционни технологии, изкуственият интелект генерира страх от съкращения във всяка индустрия, до която се докосва. За независими композитори и продуценти, които работят за създаване на оригинална музика за корпоративна реклама, например, едно приложение, което може да възпроизвежда работата им за по-малко пари за по-малко време, е плашеща перспектива.

         Джон Гроувс, главен изпълнителен директор на Groves Sound Communications и международна тежка категория по отношение на приложната рекламна музика, не се притеснява от това, че приложенията на AI биха повлияли зле на рекламната индустрия. "Тя ще се влее в нашата индустрия точно както всяка друга", казва той. "Но ние трябва да го направим на малки крачка и да осъзнаем, че новите възможности надделяват над разрушителните ефекти”.

         Д-р Колинс припомня предишните страхове от новите технологии в музикалната индустрия. "Това е като Съюзът на музикантите, който протестира срещу появяването на MIDI протокола през 80-те години", отбелязва той. “Погледнете на нещата от всички творчески възможности, които възникнаха от тази технология."

         Валерио Вералдо, главен изпълнителен директор на Melodrive, компания, която подкрепя адаптираща (adaptive)[2] музика за видео игри, твърди, че сме в навечерието на "следващата вълна на демократизация" в творческите индустрии.

         "В днешно време всеки има висококачествена цифрова камера в телефона си, но това не означава, че професионалните фотографи са изчезнали", казва той. "Мисля, че ще бъде същото и при AI. Напълно се съмнявам, че ролята на композитора ще бъде засегната от тази технология.” [2]

 

Компютри - творци

 

         Въпреки това, успешното появяване на AI в индустрията на поп музика предизвиква общи предубеждения, че артистичното въображение и творчество са присъщи човешки черти, които не могат да бъдат възпроизведени от програмирани компютри.

         "Музиката създава проблеми", казва изследователя в университета в Хъдърсфийлд Стивън Ян. “Музиката е едно от най-когнитивните, механични и емоционално ангажиращи всички човешки аспекти, което затруднява компютъра да го репликира. Това е крайната граница на AI."

         "Ние сме все още на етап изследователско творчество", казва Велардо, като се позовава на начина, по който системите на АI могат да се научат да работят творчески в границите на концептуалното пространство и в крайна сметка да имитират установените музикални стилове.

         Досега обаче трансформативната креативност или способността да се създават нови музикални стилове извън тези концептуални граници остава недостъпна. Велардо нарича това "Светият граал на изчислителното творчество”.

 

Човешки организиран звук

 

         Как ще се отрази AI върху музикалната индустрия? Изпълнителният директор на Amper Дрю Силвърстайн говори за “снижаване на летвата ... за хора, които искат да изразят творческата си визия". Но дали това ще доведе до повече предсказуемост в музиката?

         Алгоритмичният специалист Ник Колинс не мисли така, като посочва, че има "достатъчно различни програмисти, които работят по различни проекти, за да създадат разнообразна среда”.

         Една промяна, предизвикана от включването на компютри в творческия процес, е разрушаването на границата между композитора и изпълнителя. Докато навлизането на електронната музика и наличния в търговската мрежа софтуер за музикална продукция вече доведе до мащабна вълна на демократизация на процеса на създаване, AI може да направи тази демократизация една крачка напред.

         Но художникът ще изчезне ли? Паскал Пилон, главен изпълнителен директор на Landr, компания, която използва големи данни и машинно обучение за автоматизиране на крайния процес на музикално производство, известно като мастеринг, не мисли така.

         "Музиката е за разказване на истории, ние харесваме личността на художника, не мисля, че хората ще искат да слушат музика, създадена уникално от компютрите", казва той.

         Всъщност повечето от хората, които развиват тези технологии, са самите композитори. Като аудиовизуалнен художник и престижен електронен композитор Аш Кооша казва пред "Гардиън": "Опитвам се да подготвя цифровата музика по начин, който не губи човешки ценности и не се движи в посока, в която машината е оставане да решава сама какво означава музика. "

         Музикологът Джон Блекинг също пише в своята влиятелна книга: "Колко музикален е човекът?” и че музиката е в крайна сметка "човешки организиран звук". [1]

 

Generative art

 

         Генеративното изкуство се отнася до изкуството, което изцяло или частично е създадено с използването на автономна система. Автономна система в този контекст обикновено е тази, която е нечовешка и може самостоятелно да определя характеристики на произведения на изкуството, които иначе биха изисквали решения, направени пряко от художника. В някои случаи човешкият създател може да твърди, че генеративната система представлява собствената си художествена идея, а в други - че системата поема ролята на създателя.

         "Generative art" често се отнася до алгоритмичното изкуство (алгоритмично установени и компютърно генерирани творби), но творците могат да го използват и чрез системи от химия, биология, механика и роботика, интелигентни материали, математика, графиране на данни и др.

         Генеративната музика е термин, популяризиран от Брайън Ено, който използва, за да опише музика, която е винаги различна и се променя и която се създава от дадена автоматизирана система. Фугите на Бах могат да бъдат определени за генеративни, тъй като има строг основен процес, следван от композитора. Композитори като Джон Кейдж, Фармърс Менюал и Брайън Ено са използвали генеративни системи в своите произведения.

 

Генеративните похвати в поп музиката

 

         Едно често срещано оплакване относно поп музиката е, че в днешно време всичко звучи еднакво.

Ритмичните форми са еднакви, текстовете са клиширани. Има някои заслуга на този аргумент, казва Майкъл Маускапф, музиколог и социолог, който преподава в Колумбийската бизнес школа.

         "За да влезете в [US] Hot 100, за да бъдете част от тази популярна подгрупа, трябва да звучите доста нормално", казва професор Маускапф”. Той и колегата му Ноа Аскин направиха наскоро проучване, което се опита да разбере какво прави музиката успешна. Те правят това проучване, базирайки се на данни, събрани от Echo Nest, компания, собственост на Spotify, изследвайки 27 000 песни, които се появяват в US Hot 100 през последните 60 години. Изследват в какво темпо са, дали са танцувални и дали са използвали акустични звуци. И резултатът е че въпреки намерената закономерност и хомогенност, се открива и точно обратното.

         "За повечето песни, след като сте в Hot 100, след като сте в тази популярна сфера, искате да се разграничите колкото е възможно повече", казва професор Маускапф. Изследователите имаха удоволствието да разберат, че писането на хит песен не е свързано с това колко пари Вашият лейбъл ще  обезпечи за записите на тази песен или колко последователи имате за Instagram.

         Трябва да направите нещо ново, което да ви помогне да се откроите и не е лесно да се каже какво трябва да бъде това.

         "Нашият анализ подсказва, че да, разбира се, можете да слушате всичко, което Ви заобикаля и да се опитате да го съчетаете и това със сигурност ще ви служи добре, но има и елемент на случайност и елемент на изкуство. Това означава, че не може просто научно да се определи какво би могло да се превърне в хит. "

         В момента има компании, разработващи софтуер, които казват, че ще ви помогнат да напишете по-добри песни, дори да композирате хит песни.

         "Има доста разрастваща се дейност около продукцията на комерсиалната музика с AI", каза д-р Оливър Баун, старши преподавател и изследовател в UNSW. [2]

         Те правят това, като наливат купища данни в компютърна програма, за да я научат на музика, до точката, в която тя ще може да създава сама хитови песни.

         В Австралия фирма, наречена Popgun, използва AI за разработване на софтуер, който се надява, че ще направи композирането на музика по-лесно. Popgun е основан от бившия сътрудник на Twitter Стивън Филипс и Греъм Ууд като инвеститор. Компанията използва форма на дълбоко изучаване, наречена безконтролно обучение, където AI научава различните характеристики на песните - например как работи тоналността или хармонията и започва да ги изучава.

"Всеки смята, че музиката включва основно човешка дейност, а когато казват, че това е така, е защото те не могат да обяснят изрично правилата за това, което прави музиката добра или защо я харесват", казва Филипс.

 

В музиката няма ясен победител или губещ

 

         "Най-големият проблем пред всички в това пространство е тази субективна функция на това, което прави една песен добра, казва Филипс.

         "Ние не можем да кажем разликата между добро и страхотно: стоим тук и създаваме 50 песни. После ги слушаме и се оказва, че винаги една е добрата, тази, която изпъква измежду останалите и ние все още не разбираме защо и как се случва това. "

         Филипс казва, че технологията за използване на машини за писане на музика се развива бързо, като се надява Popgun да успее да направи продуктов анонс, за това което предстои още следващата година.

         Д-р Боун се съгласява, като казва, че има ясна роля за АИ да генерира широк спектър от идеи, след което "човекът прави това, което хората правят най-добре, което е чисто и придава вкус”. Филипс признава наличието на известна тревога в музикалния бизнес за това какво предстои.

 

https://www.youtube.com/watch?v=0ZE1bfPtvZo

  1. I. Experiments: A.I. Duet

 

         Дали технологиите ще помагат на музиканти или ще ги изместят? Дали това ще бъде следващия Напстър, който ще промени музикалния бизнес?

         "Не става въпрос за коли без водач, където ще има шофьори останали без работа", казва той.

         "Музиката е социална конструкция с хора, които искат да кажат нещо. И това просто ще позволи на повече хора да кажат по-добре, отколкото са го казвали преди това".

Ако всеки може да използва софтуер, за да създава музика, предназначена да бъде хит, дали всички стилове, песни ще започнат да звучат еднакво?

         Професор Маускапфт казва, че изследванията му показват, че дори и с възможността на машините да анализират популярната музика и да откриват кое я прави популярна, не може да се гарантира успех в музиката. Той също така смята, че е напълно възможно в близко бъдеще AI да е способен да създаде хит. "Мисля, че бихте могли да създаде такъв хит хит, но не можете да пресъздадете хита отново и отново. Това е движеща се мишена и в това има някакъв елемент на прилика в изкуството.

         "В някои жанрове и определени периоди от време хората наистина искат нещо малко по-различно”. Той повдига и въпроса за авторството, което се появява много в дискусиите за изкуствения интелект и творчеството. Ако компютърна програма ви е помогнала да изпеете песен, изчислена да стане хит, можете ли да поискате възнаграждение за това?

         AI все повече се превръща в част от различни видове творческа практика, от поезия до работа в областта на цифровите медии, а някои художници го виждат като инструмент, който не е различен от камерата или четката.

         "Не виждам алгоритъма да притежава нещо", казва г-н Филипс.

         "Мисля, че ще направим висококачественото композиране по-достъпно за повече хора.” [3]

 

“Музиката е едно от най-когнитивните, механични и емоционално ангажиращи всички човешки аспекти, което затруднява компютъра да го репликира. Това е крайната граница на AI. (Стивън Ян)

 

Използвани източници:

 

[1] https://www.dw.com/en/will-ai-change-the-future-of-music/a-41031406

[2] https://www.ampermusic.com

[3] https://www.abc.net.au/news/2018-09-05/how-machine-learning-might-change-the-future-of-popular-music/10147636

[4] https://nikolasbadminton.com/artificial-intelligence-future-music/

[5] https://www.musictank.co.uk/wp-content/uploads/2018/03/bpi-ai-report.pdf

 

[6] https://www.theverge.com/2018/8/31/17777008/artificial-intelligence-taryn-southern-amper-music

 

[7] http://www.musicainformatica.org/topics/push-button-bertha.php

 

 

 

 

[1] Push Button Bertha is one of the first music experiments realized with a computer, at the end of a research conducted by Martin Klein and Douglas Bolitho.

[2] In video games, adaptive music (also called dynamic or interactive music) is background music whose volume, rhythm or tune changes in response to specific events in the game.