Stability AI, ses üretim modelinin yükseltilmiş bir versiyonu olan Stable Audio 2.0’ı tanıttı. Bu yeni geliştirme, kullanıcıların, üç dakikaya kadar devam edebilen yapay zeka tarafından üretilen şarkılar oluşturmasına olanak tanıyarak selefinin maksimum süresini iki katına çıkarıyor. Eylül 2023’te piyasaya sürülen orijinal sürüm, yalnızca 90 saniyelik ses klipleri üretmekle sınırlıydı. En son sürüm, çoğu radyo dostu melodinin tipik uzunluğunu yansıtıyor. OpenAI’ın belirli kullanıcılarla sınırlı olan ses üretim aracı Voice Engine’in aksine, Stability AI’ın Stable Audio 2.0’ı web sitesi ve yakında API’si aracılığıyla halka ücretsiz olarak sunulacak. Şirket, Stable Audio 2.0’ın selefine göre önemli bir gelişmesinin, bir giriş, ilerleme ve bir çıkış dahil olmak üzere eksiksiz bir yapıya sahip şarkılar üretme yeteneği olduğunu vurguluyor. Stable Audio 2.0’ın yapay zeka tarafından üretilen müziğinin kalitesi tartışmalara yol açtı. The Verge’den bir gazeteci, oluşturulan şarkının bazı bölümlerinin çalma listesine layık olduğunu, diğerlerinin ise “balina seslerine” benzediğini ifade etti.
Bununla birlikte, kullanıcılar uyarı gücünü ayarlayarak ve yüklenen sesin ne kadarının değiştirileceğini kontrol ederek projelerini özelleştirme seçeneğine sahipler. Kalabalık tezahüratları veya klavye tıklamaları gibi ses efektleri de eklenebiliyor. Kulağa tuhaf gelmeyen ya da ruhsuz olmayan yapay zeka tarafından üretilen müzik oluşturma zorluğu sadece Stability AI’a özgü değil. Google ve Meta gibi diğer teknoloji devleri de yapay zeka ses üretimi konusunda deneyler yapıyor. Ancak, Stability AI’dan farklı olarak, bu şirketler aynı konuda geliştirici geri bildirimi toplamaya devam ettikleri için modellerini henüz kamuya açık hale getirmediler. Stable Audio’nun eğitim verileri, 800.000’den fazla ses dosyasından oluşan bir kütüphaneye sahip AudioSparx’tan alınmıştır. AudioSparx’a bağlı sanatçılara, materyallerinin modeli eğitmek için kullanılmasını engelleme seçeneği sunuldu. Telif hakkı ihlallerini önlemek için Stability AI, telif hakkıyla korunan materyallerin platforma yüklenmesini izlemek ve önlemek için içerik tanıma teknolojisini kullanmak üzere Audible Magic ile el ele verdi.