OpenAI’ın, ChatGPT tarafından yazılan yazıları yüksek bir doğrulukla tespit edebilen bir araç üzerinde çalıştığına ilişkin haberin ardından şirket, metin filigranlama konusundaki araştırmaları ve tespit yöntemini neden yayınlamadığı hakkında bazı bilgiler paylaştı. OpenAI, ChatGPT’den yazmayı tespit edebilen araçları yayınlamak için ‘kasıtlı bir yaklaşım’ benimsediğini söylüyor. OpenAI, ChatGPT’den ödevlerini yazmasını isteyerek kopya çeken öğrencileri potansiyel olarak yakalayabilecek bir araç geliştirdi ancak The Wall Street Journal’a göre şirket bunu gerçekten yayınlayıp yayınlamamayı tartışıyor. Bir OpenAI sözcüsü TechCrunch’a yaptığı açıklamada, şirketin Journal’ın haberinde açıklanan metin filigranlama yöntemini araştırdığını doğruladı, ancak “ilgili karmaşıklıklar ve OpenAI’ın ötesinde daha geniş ekosistem üzerindeki olası etkisi” nedeniyle bilinçli bir yaklaşım benimsediğini söyledi. Sözcü, “Geliştirmekte olduğumuz metin filigranlama yöntemi teknik olarak umut verici, ancak kötü aktörler tarafından atlatılmaya yatkınlık ve İngilizce konuşmayanlar gibi grupları orantısız bir şekilde etkileme potansiyeli de dahil olmak üzere alternatifleri araştırırken tarttığımız önemli riskler var” dedi. Bu, büyük ölçüde etkisiz olan yapay zeka tarafından üretilmiş metni tespit etmeye yönelik önceki çabaların çoğundan farklı bir yaklaşım olacaktır. OpenAI bile geçen yıl düşük doğruluk oranı nedeniyle önceki yapay zeka metin dedektörünü kapatmıştı.
Metin filigranı ile OpenAI, diğer şirketlerin modellerinden değil, yalnızca ChatGPT’den gelen yazıları tespit etmeye odaklanacaktır. Bunu da ChatGPT’nin kelimeleri seçme biçiminde küçük değişiklikler yaparak, yazıda daha sonra ayrı bir araç tarafından tespit edilebilecek görünmez bir filigran oluşturarak yapacak. Wall Street Journal’ın haberinin yayınlanmasının ardından OpenAI, yapay zeka tarafından üretilen içeriğin tespit edilmesine yönelik araştırmaları hakkında Mayıs ayında yayınladığı bir blog yazısını da güncelledi. Güncellemede, metin filigranının “yeniden ifade etme gibi yerelleştirilmiş tahrifatlara karşı oldukça doğru ve hatta etkili” olduğu, ancak “çeviri sistemleri kullanmak, başka bir üretici modelle yeniden ifade etmek veya modelden her kelimenin arasına özel bir karakter eklemesini istemek ve ardından bu karakteri silmek gibi küreselleştirilmiş tahrifatlara karşı daha az sağlam olduğu” kanıtlanmıştır. Sonuç olarak OpenAI, bu yöntemin “kötü aktörler tarafından atlatılmasının önemsiz” olduğunu yazıyor. OpenAI’ın güncellemesi ayrıca sözcünün İngilizce bilmeyenlerle ilgili görüşünü de yineliyor ve metin filigranının “yapay zekanın ana dili İngilizce olmayanlar için yararlı bir yazma aracı olarak kullanılmasını damgalayabileceğini” ifade ediyor. Şirket ayrıca, filigranın, metin kaynağı alanında kapsamlı araştırmaların bir parçası olarak incelediği sınıflandırıcılar ve meta veriler de dahil olmak üzere çoklu çözümlerden biri olduğunu söyledi.