OpenAI Pazartesi günü, şirketin “çok daha doğal insan-bilgisayar etkileşimine” bir adım daha yaklaştığını söylediği yepyeni bir yapay zeka modeli olan ‘GPT-4o’yu duyurdu. Yeni model; metin, ses ve görüntülerin herhangi bir kombinasyonunu girdi olarak kabul ediyor ve her üç formatta da bir çıktı oluşturabiliyor. Ayrıca duyguları tanıyabiliyor, konuşmanın ortasında araya girmenize izin veriyor ve konuşmalar sırasında neredeyse bir insan kadar hızlı yanıt veriyor. OpenAI CTO’su Mira Murati canlı yayınlanan bir sunum sırasında “GPT-4o’nun özelliği, ücretsiz kullanıcılarımız da dahil olmak üzere herkese GPT-4 seviyesinde zeka sunması” dedi. “Kullanım kolaylığı söz konusu olduğunda ilk kez ileriye doğru büyük bir adım atıyoruz.” ifadelerini kullandı. Sunum sırasında OpenAI, GPT-4o’nun İngilizce ve İtalyanca arasında canlı çeviri yaptığını, bir araştırmacının kağıt üzerinde gerçek zamanlı olarak doğrusal bir denklemi çözmesine yardımcı olduğunu ve başka bir OpenAI yöneticisine sadece nefeslerini dinleyerek “derin nefes alma” konusunda rehberlik ettiğini gösterdi.
GPT-4o’daki “o”, modelin çok modlu yeteneklerine bir gönderme olarak “omni” anlamına geliyor. OpenAI, GPT-4o’nun metin, görüntü ve ses üzerinde eğitildiğini, yani tüm girdilerin ve çıktıların aynı sinir ağı tarafından işlendiğini söyledi. Bu, şirketin önceki modelleri olan GPT-3.5 ve GPT-4’ten farklı olarak, kullanıcıların sadece konuşarak soru sormasına izin veriyor, ancak daha sonra konuşmayı metne dönüştürüyordu. Bu da ton ve duyguyu ortadan kaldırıyor ve etkileşimleri yavaşlatıyordu. OpenAI, yeni modeli önümüzdeki birkaç hafta içinde ücretsiz ChatGPT kullanıcıları da dahil olmak üzere herkesin kullanımına sunacak ve ayrıca ChatGPT’nin başlangıçta Mac için olan ve ücretli kullanıcıların bugünden itibaren erişebileceği bir masaüstü sürümünü yayınlayacak. OpenAI’ın bu duyurusu, şirketin yıllık geliştirici konferansı olan Google I/O’dan bir gün önce geldi. OpenAI’ın, GPT-4o’yu açıklamasından kısa bir süre sonra Google, kendi yapay zeka sohbet robotu Gemini’ın benzer özelliklere sahip bir versiyonunu tanıttı.