更精確地認知 NSynth Super 辦到的事情應該這麼說:「有一種新的小鼓,打下去發出的聲響,融合了鐵琴短而清脆的聲音跟悠長的長笛聲響」,而這在觸控螢幕上簡單移動就可以控制音色像小鼓多一點、還是像長笛多一點的融合方式,可說是過去無法想像的。過去要調整出理想的聲音,必須具備聲響物理學知識(例如:加強或減弱 1khz 的頻率會發生什麼效果),用無數旋鈕甚至還要用接線,以推算與經驗法則經歷可能數小時才能調整出理想的新音色,而 NSynth Super 讓這件事變簡單許多。音樂家只要這樣自問:「我想要的新樂器,要具備哪些樂器的音色特性?各自占的比例又是多少?」就能快速直覺調出新音色。
NSynth 的想法,就是納入音色、音符有關連性的思維,把樂器演奏看成一種自然語言來處理,讓 Google 小姐講話更自然的 WaveNet AI 就派上用場了。本來用在學習人類語言某音節發音接到下一個音節發音的獨特講話「習慣」,現在就變成學習某樂器從某音符到某音符之間的獨特「癖好」,因此 Magenta 在 TensorFlow 給 WaveNet 做了許多訓練。當然更有趣的是,AI 已經學會 A 樂器的演奏癖好跟 B 樂器的演奏癖好,如果我們融合一種新的樂器是 40% 的 A 樂器加上 60% 的 B 樂器,WaveNet AI 會怎麼表現呢?成果就是 NSynth Super 展示影片我們看到的各種有趣成果。2017 年 NSynth 還只是實驗中的演算法,今年則有 NSynth Super 可實際操作囉!