OpenAI, geliştiricilerin “GPT-4o Mini” adını verdiği daha hafif ve daha ucuz bir modeli piyasaya sürüyor. Tam boyutlu modellerden önemli ölçüde daha ucuza mâl oluyor ve GPT-3.5’ten daha yetenekli olduğu söyleniyor. OpenAI’ın modellerini kullanarak uygulama geliştirmek büyük bir fatura çıkarabilir. OpenAI’ı kurcalamaya gücü yetmeyen geliştiriciler, Google’ın Gemini 1.5 Flash’ı ya da Anthropic’in Claude 3 Haiku’su gibi daha ucuz modelleri tercih edebilirler. OpenAI şimdi ise hafif model oyununa giriyor. “Bence GPT-4o Mini, OpenAI’ın yapay zekayı insanlar için daha geniş çapta erişilebilir hale getirme misyonunu gerçekten yerine getiriyor. Yapay zekanın dünyanın her köşesine, her sektöre, her uygulamaya fayda sağlamasını istiyorsak, yapay zekayı çok daha uygun fiyatlı hale getirmeliyiz,” diyor API platform ürününü yöneten Olivier Godement. Bugünden itibaren Free, Plus ve Team planlarındaki ChatGPT kullanıcıları GPT-3.5 Turbo yerine GPT-4o Mini’yi kullanabilecek, Enterprise kullanıcıları ise önümüzdeki hafta erişim sağlayabilecek. Bu, GPT-3.5’in artık ChatGPT kullanıcıları için bir seçenek olmayacağı, ancak GPT-4o Mini’ye geçmeyi tercih etmeyen geliştiriciler için API aracılığıyla hala mevcut olacağı anlamına geliyor. Godement, GPT-3.5’in bir noktada API’den kaldırılacağını ancak bunun ne zaman olacağından emin olmadıklarını söyledi. Yeni, hafif model API’de metin ve görüntüyü de destekleyecek ve şirket yakında video ve ses gibi tüm çok modlu girdi ve çıktıları işleyeceğini söylüyor. Tüm bu yeteneklerle, seyahat programınızı anlayabilen ve öneriler oluşturabilen daha yetenekli sanal asistanlar gibi görünebilir. Bununla birlikte, modelin basit görevler için olduğu ifade ediliyor.
Bu yeni model, 57 akademik konuda yaklaşık 16.000 çoktan seçmeli sorudan oluşmuş bir ölçüt sınavı olan Measuring Massive Multitask Language Understanding (MMLU) sınavında yüzde 82 puan aldı. MMLU 2020’de ilk kez tanıtıldığında, çoğu model bu sınavda oldukça kötüydü; modeller önceki kıyaslama sınavları için fazla gelişmiş olduğundan amaç da buydu. GPT-3.5 bu kıyaslamada yüzde 70, GPT-4o yüzde 88,7 puan aldı. Google, Gemini Ultra’nın yüzde 90 ile şimdiye kadarki en yüksek puanı aldığını iddia ediyor. Karşılaştırıldığında, rakip modeller Claude 3 Haiku ve Gemini 1.5 Flash sırasıyla yüzde 75.2 ve yüzde 78.9 puan aldı. Araştırmacıların MMLU gibi kıyaslama testlerine temkinli yaklaştığını belirtmekte fayda var çünkü bu testlerin uygulanma şekli şirketten şirkete küçük farklılıklar gösteriyor. The New York Times’ın haberine göre, bu durum farklı modellerin puanlarının karşılaştırılmasını zorlaştırıyor. Ayrıca, yapay zekanın veri setinde bu cevaplara sahip olma olasılığı da var, bu da aslında hile yapmasına izin veriyor ve genellikle üçüncü taraf değerlendiriciler sürecin bir parçası değil. GPT-4o Mini’nin piyasaya sürülmesi, ucuza yapay zeka uygulamaları geliştirmeye aç olan geliştiricilere envanterlerine ekleyebilecekleri bir araç daha sunuyor. OpenAI, finansal teknoloji girişimi ‘Ramp’ın GPT-4o Mini’yi kullanarak makbuzlardaki gider verilerini çıkaran bir araç oluşturarak modeli test etmesine izin verdi. Böylece, metin kutuları arasında boğulmak yerine, bir kullanıcı makbuzunun resmi yüklenebilir. Model hepsini onlar için sıralar. Bir e-posta istemcisi olan Superhuman da GPT-4o Mini’yi test etti ve onu, e-posta yanıtları için bir otomatik öneri özelliği oluşturma amacıyla kullandı. Maksat, geliştiricilerin GPT-4 gibi daha büyük ve daha pahalı bir modelle yapamayacakları tüm uygulamaları ve araçları oluşturmaları için hafif ve ucuz bir şey sağlamaktır. Birçok geliştiricinin, en sağlam modellerden birini çalıştırmak için gereken göz kamaştırıcı bilgi işlem maliyetlerini ödemeden önce Claude 3 Haiku veya Gemini 1.5 Flash’a yönelme ihtimali yüksek.