Google, metin açıklamalarından müzik üretebilen ancak yayınlamayan bir AI oluşturdu • Tmzilla

Google’ın etkileyici yeni AI sistemi, metin açıklaması verilen herhangi bir türde müzik üretebilir. Ancak risklerden korkan şirketin onu piyasaya sürmek için acil bir planı yok.
MusicML olarak adlandırılan Google, kesinlikle şarkı için ilk üretici yapay zeka sistemi değil. Müziği görselleştirerek besteleyen bir yapay zeka olan Riffusion’ın yanı sıra Google’ın kendi AudioML’si ve OpenAI’nin Jukebox’ı olan Dance Diffusion gibi başka girişimler de oldu. Ancak teknik sınırlamalar ve sınırlı eğitim verileri nedeniyle, hiçbiri özellikle karmaşık veya aslına uygun şarkılar üretemedi.
MusicML belki de bunu yapabilen ilk kişidir.
Bu haftaki akademik bir makalede ayrıntılarıyla açıklanan MusicML, yaratıcıların deyimiyle “önemli karmaşıklığın” (ör. “unutulmaz bir saksafon solosuna sahip büyüleyici bir caz şarkısı ve bir solo şarkıcı” veya “düşük bas ve güçlü tekme ile Berlin ’90’ların tekno.” Şarkıları, dikkate değer bir şekilde, yaratıcı veya müzikal olarak uyumlu olmasa da, bir insan sanatçının besteleyebileceği bir şeye benziyor.
Gerçekten de, nasıl olduğunu abartmak zor iyi Orada verilen örneklerde ses, döngüde bir müzisyen veya bir çalgıcı değil. MusicML biraz uzun ve dolambaçlı açıklamalarla beslendiğinde bile enstrümantal riffler, melodiler ve ruh halleri gibi nüansları yakalamayı başarır.
Örneğin, aşağıdaki örneğin başlığı, “uzayda kaybolma deneyimini uyandırır” bitini içeriyordu ve kesinlikle bu cephede (en azından benim kulaklarıma göre) veriyor:
İşte “Bir atari oyununun ana müziği” cümlesiyle başlayan bir açıklamadan oluşturulmuş başka bir örnek. Makul, değil mi?
MusicLM’nin yetenekleri şarkılardan kısa klipler oluşturmanın ötesine geçer. Google araştırmacıları, sistemin ister mırıldanılsın, ister söylensin, ıslık çalınsın veya bir enstrümanda çalınsın, mevcut melodiler üzerine inşa edilebileceğini gösteriyor. Ayrıca MusicLM, sırayla yazılan çeşitli tanımları alabilir (ör. “meditasyon zamanı”, “uyanma zamanı”, “koşma zamanı”, “%100 verme zamanı”) ve bir tür melodik “hikaye” veya anlatı yaratabilir. Uzunluğu birkaç dakikaya kadar değişen, bir film müziği için mükemmel şekilde uygun.
“Bir video oyununda çalınan elektronik şarkı”, “nehrin yanında çalınan meditasyon şarkısı”, “ateş”, “havai fişek” dizisinden gelen aşağıya bakın.
Bu, MusicLM’nin kusursuz olduğu anlamına gelmez – doğrusunu söylemek gerekirse, bundan çok uzaktır. Örneklerden bazıları, eğitim sürecinin kaçınılmaz bir yan etkisi olan çarpık bir kaliteye sahiptir. Ve MusicLM teknik olarak koro armonileri de dahil olmak üzere vokal üretebilse de birçoğu arzulanan çok şey bırakıyor. “Şarkı sözlerinin” çoğu, birkaç sanatçının karışımı gibi ses çıkaran sentezlenmiş seslerle söylenen, zar zor tutarlı olandan saf anlamsız sözlere kadar uzanıyor.
Yine de Google araştırmacıları, eğitim verilerinden alınan telif hakkıyla korunan materyalleri oluşturulan şarkılara dahil etme talihsiz eğilimi de dahil olmak üzere MusicML gibi bir sistemin ortaya çıkardığı birçok etik zorluğa dikkat çekiyor. Bir deney sırasında, sistemin ürettiği müziğin yaklaşık %1’inin doğrudan üzerinde eğitim aldığı şarkılardan kopyalandığını buldular; görünüşe göre onları MusicML’yi mevcut durumunda yayınlamaktan caydıracak kadar yüksek bir eşik.
Makalenin ortak yazarları, “Kullanım durumuyla ilişkili yaratıcı içeriğin potansiyel olarak kötüye kullanılması riskini kabul ediyoruz” diye yazdı. “Müzik üretimiyle ilgili bu risklerin üstesinden gelmek için gelecekte daha fazla çalışma yapılması gerektiğini güçlü bir şekilde vurguluyoruz.”
MusicML veya benzeri bir sistemin bir gün kullanıma sunulacağını varsayarsak, büyük yasal sorunların gündeme gelmesi kaçınılmaz görünüyor. Daha basit AI sistemleri olsa da zaten sahipler. 2020’de Jay-Z’nin plak şirketi, Billy Joel’in “We Didn’t Start the Fire” gibi şarkıların Jay-Z cover’larını oluşturmak için yapay zekayı kullandığı için bir YouTube kanalı olan Vocal Synthesis’e telif hakkı ihtarı verdi. YouTube, videoları ilk başta kaldırdıktan sonra, yayından kaldırma isteklerinin “eksik” olduğunu fark ederek videoları eski durumuna getirdi. Ancak derin sahte müzik hala belirsiz yasal zeminde duruyor.
Şu anda Music Publishers Association’da yasal bir stajyer olan Eric Sunray tarafından yazılan bir teknik inceleme, MusicML gibi yapay zeka müzik oluşturucuların, “eğitim sırasında aldıkları çalışmalardan tutarlı ses duvar halıları” oluşturarak müzik telif hakkını ihlal ettiğini ve böylece Amerika Birleşik Devletleri Telif Hakkı Yasası’nın çoğaltılmasını ihlal ettiğini savunuyor. sağ.” Jukebox’ın yayınlanmasının ardından eleştirmenler, AI modellerini telif hakkıyla korunan müzik materyalleri üzerinde eğitmenin adil kullanım teşkil edip etmediğini de sorguladılar. Görüntü, kod ve metin üreten AI sistemlerinde kullanılan ve genellikle içerik oluşturucuların bilgisi olmadan web’den alınan eğitim verileriyle ilgili benzer endişeler dile getirildi.
Bir kullanıcı açısından, Waxy’den Andy Baio, bir AI sistemi tarafından üretilen müziğin türev bir çalışma olarak kabul edileceğini ve bu durumda yalnızca orijinal öğelerin telif hakkı ile korunacağını tahmin ediyor. Elbette, bu tür müziklerde neyin “orijinal” olarak kabul edilebileceği belli değil; bu müziği ticari olarak kullanmak, keşfedilmemiş sulara girmektir. Üretilen müziğin parodi ve yorum gibi adil kullanım kapsamında korunan amaçlar için kullanılması daha basit bir meseledir, ancak Baio mahkemelerin dava bazında kararlar vermesini beklemektedir.