Geçtiğimiz hafta OpenAI, metinleri fotogerçekçi videolara dönüştürebilen ve tüm dünyaları simüle edebilen son teknoloji bir yapay zeka aracı olan Sora’yı tanıtmıştı. Şirket, karlı sahnede gezinen bir çift ve toprak yolda klasik beyaz bir SUV üzerinde uçan bir kamera gibi harika örnekler paylaştı. Şimdi ise şirket, 3D çevremizin temel yönlerini kavrayabildiği için Sora’yı bir “dünya simülatörü” olarak adlandırdı. Bir difüzyon transformatörü modeline dayanan Sora, metin ve videoyu birbirine bağlamak için çok sayıda altyazılı video kullanılarak eğitildi. OpenAI, Sora’nın “fiziksel dünyadaki insanların, hayvanların ve ortamların bazı yönlerini simüle edebildiğini” belirtiyor. Yapay zeka tarafından üretilen klipler, Sora’nın 3D alanları anladığını gösteren yumuşak kamera hareketleriyle çekim yapma yeteneğini ortaya koyuyor.
OpenAI, Sora’nın oyun da dahil olmak üzere hem fiziksel hem de dijital alanlarda gelişmiş simülatörlerin önünü açabileceğine inanıyor. Buna; “nesneler, hayvanlar ve bunların içinde yaşayan insanlar” da dahil olacak. Bununla birlikte, Sora’nın sınırlamaları var. Bir kişinin bir kurabiyeyi iz bırakmadan ısırması veya bir bardağın, önce, kırılmadan akması gibi neden ve sonuçlarla mücadele ediyor. OpenAI potansiyel kötüye kullanım konusunda dikkatli davranıyor ve Sora’yı kademeli olarak “zarar veya riskler açısından kritik alanları değerlendirmek üzere kırmızı ekip üyelerine” bırakmayı planlıyor. Sora araştırmacısı Bill Peebles Wired’a verdiği demeçte, “Bunun güvenlikle ilgili tüm sonuçları konusunda çok dikkatli olacağız” dedi. Sora, kusurlarına rağmen, yapay zeka tarafından üretilen videoların gerçeklikten ayırt edilemeyeceği bir geleceğe göz kırpıyor.