NASA, Dünya bilimi misyonlarının yalnızca 2024 yılında yaklaşık çeyrek milyon terabayt veri üreteceğini tahmin ediyor. İklim bilimcilerin ve araştırma camiasının bu ham uydu verilerini verimli bir şekilde inceleyebilmesi için IBM, HuggingFace ve NASA, ormansızlaşmayı takip edebilecek, mahsul verimini tahmin edebilecek ve sera gazı emisyonlarını rafa kaldırabilecek yeni bir iklim ve Dünya bilimi yapay zeka sınıfının temelini oluşturacak açık kaynaklı bir jeo-uzamsal temel modeli oluşturmak için işbirliği yaptı. Bu proje için IBM, NASA’nın bir yıllık Harmonize Landsat Sentinel-2 uydu verilerini (HLS) kullanarak temel model olarak hizmet etmek üzere yakın zamanda piyasaya sürülen Watsonx.ai’den yararlandı. Bu veriler, ESA’nın 13 spektral bantta kara ve kıyı bölgeleri üzerinde yüksek çözünürlüklü optik görüntüler elde etmek üzere inşa edilen Sentinel-2 uydu çifti tarafından toplanıyor.
HuggingFace ise modeli açık kaynaklı yapay zeka platformunda barındırıyor. IBM’e göre ekip, “sel ve yanık izi haritalaması için etiketlenmiş veriler” üzerinde modele ince ayar yaparak, modelin performansını yarı yarıya daha fazla veri kullanarak mevcut son teknolojiye göre yüzde 15 artırmayı başardı. IBM Research AI Başkan Yardımcısı Sriram Raghavan bir basın açıklamasında, “İklim değişikliği gibi kritik keşif alanlarını hızlandırmak için açık kaynaklı teknolojilerin temel rolü hiç bu kadar net olmamıştı” dedi. “IBM’in esnek, yeniden kullanılabilir yapay zeka sistemleri oluşturmaya yönelik temel model çabalarını NASA’nın dünya-uydu verileri havuzuyla birleştirerek ve bunları önde gelen açık kaynaklı yapay zeka platformu Hugging Face’te kullanıma sunarak, gezegenimizi iyileştirecek daha hızlı ve daha etkili çözümler uygulamak için işbirliğinin gücünden yararlanabiliriz.” ifadelerini kullandı.
IBM ve NASA gezegenimiz hakkında yeni keşifleri teşvik etmek için işbirliği yapmıştı
IBM resmi web sitesinde; ”Amaç, bilimi ilerletmek ve değişen çevreye uyum sağlamamıza yardımcı olacak yeni bilgiler için geniş veri kümelerinden yararlanmayı kolaylaştıran ayarlanabilir, yeniden kullanılabilir temel modellerdir. İklim değişikliği orman yangınlarını körükleyen daha fazla sıcaklık ve kuraklık oluşturuyor. Duman, hava kalitesini nasıl etkileyecek? Geçtiğimiz yılın kavurucu sıcak hava dalgaları mısır ve buğday verimini nasıl etkileyecek? Bunlar, bilim insanlarının milyonlarca yer bilimi makalesini tarayarak ve uydu görüntülerinden oluşan dağları inceleyerek yanıtlamak istedikleri sorulardan sadece birkaçı. Yeni bir işbirliğiyle NASA ve IBM, petabaytlarca metni ve uzaktan algılama verilerini analiz etmek için yapay zeka temel modelleri oluşturarak belirli sorulara ve görevlere göre uyarlanmış yapay zeka uygulamaları oluşturmayı kolaylaştırıyor.
NASA’nın Marshall Uzay Uçuş Merkezi’nde kıdemli bir araştırma bilimcisi olan Rahul Ramachandran, “Bundan sadece NASA değil, diğer kurum ve kuruluşlar da faydalanacak” dedi. “Bu modellerin bilgi ve enformasyonu herkes için daha erişilebilir kılacağını ve insanları en son bilime dayalı keşifler ve kararlar almak için veri setlerimizi kullanmayı kolaylaştıran uygulamalar geliştirmeye teşvik edeceğini umuyoruz.” ifadelerini kullandı. Temel modeller büyük miktarlarda ham veriyi alır ve açık bir talimat olmadan bunların altında yatan yapıyı bulur. Bir temel modeli önceden eğitirseniz, ona sınırlı sayıda elle etiketlenmiş örnekle tamamen yeni bir görev öğretebilirsiniz. Geleneksel olarak, makine öğrenimini uzaktan algılama verilerine uygulamanın önündeki ana engellerden biri eğitim örneklerinin yetersizliğiydi. Uydu verilerindeki ağaçlar ve ekinler gibi şeyler insan uzmanlar tarafından bölümlere ayrılır ve etiketlenir, böylece bilgisayar hangi özelliklere odaklanacağını bilir.
Transformatör tabanlı modellerin yakın zamanda kullanıma sunulması bu engeli ortadan kaldırabilir. NASA, 70 petabaytlık yer bilimi verisinin üzerinde oturuyor ve bu sayının Yüzey Suyu ve Okyanus Topografyası (SWOT) ve NISAR dahil bir düzine yeni görevin başlatılmasıyla 2030 yılına kadar 600 petabayta ulaşması bekleniyor. Ramachandran, vakıf modellerinin NASA verilerinin kullanışlılığını katlayabileceğinden umutlu. Bu, NASA’nın Açık Kaynak Bilim Girişimi aracılığıyla veri, kod ve yapay zeka modellerini herkesin kullanımına sunmaya yönelik daha geniş bir girişiminin bir parçası. IBM ve NASA iki temel model oluşturacak. İlki, literatürü tematik olarak düzenlemek ve yeni bilgileri aramayı ve keşfetmeyi kolaylaştırmak için yer bilimi dergileri üzerinde eğitilecek. İkinci model ise USGS ve NASA’nın popüler veri seti olan ve dünya yörüngesindeki uydular tarafından yakalanan arazi kullanım değişikliklerinin bir kaydı olan Harmonized Landsat Sentinel-2 (HLS) üzerinde eğitilecek. Sonraki uygulamalar arasında doğal tehlikelerin tespit edilmesi ve doğal kaynak yönetimi için bitki örtüsü ve yaban hayatı habitatındaki değişikliklerin izlenmesi yer alıyor.” ifadelerine yer vermişti.