Yapay zeka teknolojisi ve araçlarıyla 2023'te ilk kez tanışan dünya toplumları, bu dönüm noktası olayı gündeminden hiç düşürmedi. Yapay zeka modellerinin günlük hayatta kullanımı genişledikçe bu teknolojilerin basmakalıp yaklaşımları ve ön yargıları da sorgulanıyor. En hararetli tartışılan konulardan biri de "Yapay zeka ırkçı mı?" sorusudur. Elimizde bu soruya "evet" cevabını verebilecek kadar veri ve kanıt da mevcut.
Bu noktada Anadolu Ajansı'nın Ayrımcılık Hattı servisinin yürüttüğü soruşturmadan bahsedebiliriz. Ayrımcılık Hattı, Midjourney'nin "Gazze'de yaşayan bir aile" komutu için ürettiği fotoğrafları inceleyerek yapay zekanın Gazze'yi nasıl gördüğünü araştırdı. Araştırmada incelenen 120 karenin 38'inde aile üyeleri arasında genç veya yetişkin erkek bulunmuyor. Erkekleri kadın kıyafetleri içinde hatalı şekilde gösteren 10 fotoğraf. Fotoğraflarda Gazze'deki evlerin neredeyse tamamı çatışmalar nedeniyle yıkılmış ve hasar görmüştü. 120 karenin sadece 21'inde ailelerin gülümsemesi, onlara mutlu olduklarını anımsatacak şekilde tebessüm ediyor. 90’dan fazla karede ise aile üyelerinin yüzlerinde üzüntü, endişe ve korku halinin hakim olduğu görülüyor.
Bu sonuç ise bize şu soruyu sorduruyor; yapay zeka, kültürleri ve toplumları bu şekilde, ön yargılı ve basmakalıp bir anlayışla resmetmeyi nereden öğrendi? Bu sorunun cevabını bulabilmek için öncelikle görsel yapay zeka araçlarının nasıl eğitildiğine, nasıl işlediğine ve nasıl öğrendiğine bakmamız gerekiyor.
Öncelikle yapay zeka modellerinin eğitimi ve öğreniminin ana gıdasının veri olduğunu belirtmekte fayda var. Yapay zeka aracı öncelikle görsel bilgileri toplayacak. Görsel yapay zeka araçlarına yönelik veri toplama süreci, açık kaynak veri kümeleri, internet taraması, kullanıcı tarafından sağlanan veriler, mobil uygulamalar ve Nesnelerin İnterneti gibi çeşitli kaynaklardan sağlanır. Bu veri kümeleri dünyanın dört bir yanından farklı kültürleri, ırkları ve popülasyonları kapsayan milyonlarca görüntüden oluşuyor. Veri havuzuna yapay zeka ile ne kadar çok veri elde ederse, oluşturduğu modeller de o kadar doğru ve gerçekçi çıktılar veriyor.
Ardından veri temizleme ve etiketleme aşamasına geçiyoruz. Toplanan verilerden gereksiz ve yanlış bilgiler çıkarılır. Sabit verilerin geri kalanı pratik için işaretlenmiştir. Etiket her görsel nesnenin etiketini temsil eder. Bir kedi resminin üzerine "kedi" çıkartması, kalemle bir nesnenin üzerine ise "kalem" çıkartması yapıştırılır. Etiketleme manuel olarak veya otomasyon sistemleri ile yapılabilmektedir. Örneğin Microsoft'un yalnızca Hindistan'da bir milyondan fazla kişiyi çalıştırdığını ve etiketleme görevleri için günde 1 dolardan az para ödediğini biliyoruz.
Bu işlenmiş ve etiketlenmiş veriler, makine öğrenimi modellerinin eğitimi için kullanılır. Derin öğrenme algoritmaları, temiz veriler sayesinde belirli kalıpları ve özellikleri öğrenir. Modellerin eğitilmesiyle artık doğruluk testi aşamasına geçilir. Bu aşamada, modelin tahminleri gerçek etiketlerle karşılaştırılır ve performans metrikleri hesaplanır. Doğruluk testini geçen modeller kullanıma hazır hale getirilir.