MusicLM, DALL-E'nin metinler aracılığıyla görüntüler oluşturmasına benzer şekilde, metin istemlerinden dakikalarca müzik parçaları oluşturabilıyor, ıslıklı veya uğultulu bir melodiyi başka enstrümanlara dönüştürebiliyor.
Uygulamanın örneklerine buradan ulaşabilirsiniz.
Geçmişte benzeri çalışmalar olsa da MusicLM'in hem ses kalitesi hem de metin açıklamasına bağlılık açısından önceki sistemlerden daha iyi performans gösterdiği açıklandı.
Atmosfer ve hatta belirli enstrümanlar öngören paragraf uzunluğundaki açıklamalardan oluşturulmuş gerçek şarkılara benzeyen 30 saniyelik parçaların yanı sıra "melodik tekno" gibi bir veya iki kelimeden oluşturulmuş beş dakikalık parçalar var.
MusicLM, insan vokallerini bile simüle edebiliyor, ancak sesler yine de insan sesine oranla statik kalıyor.
Uygulama insanların kullanımına henüz açılmadı. Şirket ne zaman açılacağına dair bir yorumda bulunmadı.
Kaynak:
Gelişmelerden zamanında haberdar olmak istiyor musunuz? Google News’te KONHABER'e abone olun.