ABD'de yapılan bir araştırmada, veri havuzlarının, hâlihazırda yaygın olarak kullanılan yapay zekâ sohbet robotlarının dil modellerinin politik görüşlerine etkisi üzerinde incelemeler yapıldı.
Bilim insanları bu kapsamda, 14 farklı dil modeli üzerinde, yatay eksende sağ ve sol olmak üzere ekonomik değerler, dikey eksende ise liberal ve muhafazakâr olmak üzere sosyal değerler bulunan siyasi pusula testini uyguladı.
Ayrıca, dil modellerini eğitmek için kullanılan haberler, tartışma forumları, kitaplar gibi çeşitli veri kaynaklarının içeriğindeki politik eğilimlerin, doğal dil işleme modeli üzerindeki etkisi ve söz konusu etki sonucunda dil modellerinin ürettiği dezenformasyon ve nefret söylemleri incelendi.
Araştırma sonucuna göre, eğitildikleri veri havuzundaki kaynakların politik eğilimlerini taşıyan dil modellerinin, görüşleriyle paralel yönelimde nefret söylemi ve dezenformasyona sebep olduğu kaydedildi.
Buna ek olarak, Eski ABD Başkanı Donald Trump'ın göreve başladığı 20 Ocak 2017 tarihi milat alınarak, bu tarihten önceki ve sonraki veri setleriyle eğitilen dil modelleri kıyaslandığında, Trump dönemi ve sonrasına ait verilerle eğitilen dil modellerinin eğilimlerinin, siyasi pusulada daha uçlarda konumlandığı tespit edildi.
Dil modelleri arasında "BERT" varyantlarının "GPT" modellerine kıyasla daha muhafazakâr eğilimli olduğu ve aynı firmanın geliştirdiği çeşitli dil modellerinin politik eğilimlerinde de azımsanamaz farklılıklar gözlemlendiği belirtildi.
Eğitilen dil modellerinin ekonomik konulara kıyasla, sosyal konulara daha taraflı yaklaşması, sosyal konulara ilişkin veri bolluğuna karşın ekonomik yorumlama için daha geniş bir veri seti gerekliliğine bağlandı.
Hiçbir dil modelinin sosyal taraflılıktan tamamen arınmış olamayacağını vurgulayan araştırmacılar, aşırı politik görüşleri temsil eden kaynaklar kullanılarak eğitilen dil modellerinin, toplumda var olan kutuplaşmayı daha da derinleştirebilmesinin teorik olarak mümkün olduğu konusunda uyardı.
Araştırmanın sonuçları, "Association for Computational Linguistics"in yıllık toplantı raporunda yayımlandı.
Kaynakça
0 yorum