Son birkaç haftadır teknoloji dünyasının gündemi Microsoft, Google, OpenAI gibi şirketler tarafından geliştirilen ve kullanılan dil modellerine odaklanmış durumda. Ancak Facebook’un ana şirketi Meta, bu alanda önemli çalışmalar yapmaya devam ediyor ve bugün LLaMA adlı yeni bir yapay zeka dil oluşturucusunu piyasaya sürüyor. LLaMA ChatGPT ya da Bing gibi değil; herkesin konuşabileceği bir sistem değil. Aksine, Meta’nın “bu önemli ve hızla değişen alana erişimi demokratikleştirmek” umuduyla paylaştığını söylediği bir araştırma aracı. Başka bir deyişle; uzmanların yapay zeka dil modellerinin önyargı ve toksisiteden basitçe bilgi uydurma eğilimlerine kadar sorunlarını çözmelerine yardımcı olmak. Bu amaçla Meta, LLaMA’yı (aslında tek bir sistem değil, farklı boyutlarda modellerden oluşan bir dörtlü) “araştırma kullanım durumlarına odaklanan ticari olmayan bir lisans” altında yayınlıyor ve üniversiteler, STK’lar ve endüstri laboratuvarları gibi gruplara erişim izni veriyor.
Şirket yazısında, “Tüm yapay zeka topluluğunun (akademik araştırmacılar, sivil toplum, politika yapıcılar ve endüstri) genel olarak sorumlu yapay zeka ve özellikle sorumlu büyük dil modelleri hakkında net kurallar geliştirmek için birlikte çalışması gerektiğine inanıyoruz” dedi. “Topluluğun LLaMA’yı kullanarak neler öğrenebileceğini ve sonunda neler inşa edebileceğini görmek için sabırsızlanıyoruz.” ifadelerini kullandı. Bir araştırma makalesinde Meta, LLaMA modelinin ikinci en küçük versiyonu olan ‘LLaMA-13B’nin OpenAI’ın popüler GPT-3 modelinden “çoğu kıyaslamada” daha iyi performans gösterdiğini, en büyüğü olan ‘LLaMA-65B’nin ise DeepMind’ın Chinchilla70B ve Google’ın PaLM 540B gibi “en iyi modellerle rekabet edebildiğini” iddia ediyor. (Bu isimlerdeki sayılar, her bir modeldeki milyarlarca parametreyi ifade ediyor. Sistemin büyüklüğünün bir ölçüsü ve gelişmişliğinin kabaca bir yaklaşımı, ancak bu iki niteliğin aynı anda ölçeklenmesi gerekmiyor).
LLaMA-13B eğitildikten sonra tek bir veri merkezi sınıfı Nvidia Tesla V100 GPU üzerinde de çalışabilir. Bu durum, bu tür sistemlerde test yapmak isteyen daha küçük kurumlar için sevindirici bir haber olacak, ancak bu tür ekipmanlara ulaşamayan yalnız araştırmacılar için pek bir şey ifade etmiyor. Meta’nın piyasaya sürülmesi, kısmen yapay zeka sohbet robotlarını çevreleyen bazı vızıltıları kaçırdığı için de dikkate değer. Microsoft’un Bing’in lansmanını aceleye getirdiği için aldığı eleştiriler ve kendi sohbet robotunun bir demoda hata yapmasının ardından Google’ın hisse senedi fiyatının düştüğü göz önüne alındığında, bu kötü bir şey olmayabilir.
Meta aslında geçmişte kendi erişilebilir yapay zeka sohbet robotlarını piyasaya sürdü. BlenderBot adlı bir tanesi çok iyi olmadığı için eleştirilirken, bilimsel makaleler yazmak için tasarlanan Galactica adlı bir diğeri, bilimsel saçmalıklar üretmeye devam ettikten sadece üç gün sonra çevrimdışı duruma getirildi. LLaMA dörtlüsü ile Meta muhtemelen daha nazik bir karşılama umuyor. CEO Mark Zuckerberg bir Facebook gönderisinde “Bugün, araştırmacıların çalışmalarını ilerletmelerine yardımcı olmak için tasarlanmış LLaMA adlı yeni bir son teknoloji yapay zeka büyük dil modelini piyasaya sürüyoruz” dedi. “LLM’ler metin üretme, sohbet etme, yazılı materyalleri özetleme ve matematik teoremlerini çözme veya protein yapılarını tahmin etme gibi daha karmaşık görevlerde çok fazla umut vaat etti. Meta olarak bu açık araştırma modeline bağlıyız ve yeni modelimizi yapay zeka araştırma topluluğunun kullanımına sunacağız.” ifadelerini kullandı.