Bilim insanları, yeni yürümeye başlayan bir çocuğun başa takılan kamerasından alınan 61 saatlik görsel-işitsel kayıtları kullanarak bir yapay zeka modeline “sözcük öğrenmeyi öğretme” konusunda çığır açtı. Science dergisinde yer alan çalışma, dil öğrenmenin düşündüğümüzden daha kolay olabileceğini gösteriyor. Çalışmanın kıdemli yazarı ve New York Üniversitesi’nde doçent olan Brenden Lake, “İlk kez bir yapay zeka modelini tek bir çocuğun gözleri ve kulakları aracılığıyla kelimeleri öğrenmesi için eğitebileceğinizi gösterdik” dedi. Araştırma ekibi, yapay zekanın anlaması için görüntüleri ve yazılı dili işlemek üzere görüntü ve metin kodlayıcıya sahip bir makine öğrenimi modeli kullandı. Model, yürümeye başlayan çocuğun kamera görüntülerinden hareketsiz kareler ve sesten yazıya dökülmüş metinle beslendi. Bu yöntem, yapay zekanın, tıpkı çocukların öğrendiği gibi, kelimeleri nesneler ve görsellerle ilişkilendirmesini sağladı. Araştırmacılar, modeli eğitirken çocuk tarafından takılan hafif kafa aygıtı aracılığıyla çekilen 60 saatten fazla video/ses kaydını kullandılar.
Cihaz, yürümeye başlayan çocuk tarafından altı aylıktan iki yaşına kadar aralıklı olarak takıldı. Bu 19 aylık süre boyunca cihaz, çevredeki insanlardan gelen 37.500’den fazla yazıya dökülmüş ifadeyle ilişkili 600.000’den fazla video karesi topladı.
Ortamdaki konuşmaların ve video karelerinin yakalanması, büyümekte olan bir çocuğun günlük deneyimlerine ışık tuttu. Araştırmacılar, yapay zeka modelini test etmek için, çocukların dil öğrenimini değerlendirmeye benzer bir yöntem kullandılar. Yapay zekaya eğitim setinden dört görüntü gösterildi ve top gibi belirli bir nesneyi tanımlaması istendi. Bebek kamerasıyla eğitilen model, rastgele tahminlerden daha iyi olan %61,6 doğruluk oranına ulaştı. Ayrıca yeni yürümeye başlayan çocuğun kayıtlarında olmayan yeni görüntülerdeki nesneleri de tanımlayarak öğrendiklerini uygulama becerisi gösterdi. Makalenin başyazarı Wai Keen Vong, “Bu bizi oldukça şaşırttı” dedi. Bu çalışma, çocukların etkili kelime anlama için karmaşık mekanizmalara ihtiyaç duyduğu fikrine meydan okuyor. Araştırmada yer almayan Skidmore College’da doçent olan Jessica Sullivan, “Şimdi en azından bir durumda bunun mümkün olduğunu görüyorum” dedi. Ancak bu çalışma çocukların kelimeleri nasıl öğrendiğini kanıtlamıyor, makineler ve muhtemelen insanlar için neyin mümkün olduğunu gösteriyor. Indiana Üniversitesi Bloomington profesörlerinden Linda Smith’e göre, örüntü tanımanın ötesindeki diğer faktörler muhtemelen insan öğrenmesinde rol oynamaktadır. Araştırma, insanlar gibi öğrenen ve yeni öğrenme yolları sunan yapay zeka modellerinin oluşturulmasına yardımcı olabilir. Mevcut büyük dil modelleri (LLM’ler) eğitim için astronomik verilere ihtiyaç duyuyor. Çalışma, doğru verilerle makine ve insan öğrenimi arasındaki farkın önemli ölçüde azalabileceğini gösteriyor. Lake, “Günümüzün yapay zeka sistemlerinin, bir çocuğun dil öğrenirken aldığı türden oldukça az miktarda veriye maruz kaldığında ne kadar çok şey öğrenebildiğine şaşırdım” dedi.
