Bilgisayarlar İş birliği Yapmayı İnsanlardan Daha İyi Öğreniyor
Bilgisayarlar, tüm oyuncular arasından en iyi sonucu almayı amaçlayan oyunlarda kendilerine işbirliği yapmayı öğretti.

Araştırmacıların söylediklerine göre yapay zekâyı satranç, dama gibi kazan-kaybet oyunlarında zafere ulaşmak konusunda eğitmek daha zor. Bu alandaki ilerlemeler insan-makine işbirliğini geliştirmeye yardımcı olabilir.

20 yıl önce bir süper bilgisayar,  o zamanlar dünya satranç şampiyonu olan Garry Kasparov’u yendi. Yakın zamanda ise yapay zekâ araştırmacıları Go ve poker gibi daha fazla hesaplama becerisi gerektiren oyunlarda insanları yenebilen programlar geliştirdiler. Fakat bunlar tek bir oyuncunun kazandığı ve diğerlerinin kaybettiği ‘kazanan hepsini alır’ ya da ‘sıfır toplam’ temalı oyunlardı. Araştırmacılar oyundaki herkesin sonucu optimize etmek için birlikte çalıştığı, iş birliği gerektiren oyunlarla ilgili henüz yeterince çalışmış değil. Oyunun mantığı bir oyuncunun diğer oyunculara "ihanet ederek" kendi kişisel sonucunu iyileştirmesini gerektirse bile.

Bu tarz oyunlara ‘tavuk’ da dahildir. Bu oyunda iki araba birbirine doğru ilerler ve son anda yoldan saparlar. Diğeri ise, bir oyun teorisi klasiği olan ‘tutuklunun ikilemi’ oyunudur. Burada da, iki kişi bir konuda suçlanır ve birbirlerine sadık kalıp suçu inkar ederlerse her biri 1 yıl gibi  hafif bir ceza alır. Eğer bir mahkum diğerine ihanet ederse serbest bırakılır ve partneri 3 yıllık bir ceza alır. İkisi de birbirini ispiyonlarsa 2 yıl ceza alırlar. Bir tur oynandıktan sonra oyunun mantığı oyunculardan birinin diğerine ihanet etmesini ister. Birkaç kez oynandıktan sonra ise, oyuncular en hafif cezayı alabilmek için birbirleriyle iş birliği yapmaya başlarlar.

Utah, Provo’daki Brigham Young Üniversitesi’nden Jacob Crandall ve meslektaşları, makinelerin de bu tarz oyunları öğrenebileceğini görmek istediler. Böylece araştırmacılar; tavuk, mahkumun ikilemi ve ‘alternator’ adı verilen başka bir iş birliği oyununun bilgisayar versiyonunu oynamak için insan ve makineleri bir araya getirdiler. Takımlar iki kişi ve iki bilgisayar ya da bir kişi ve bir bilgisayar şeklinde oluşturuldu. Araştırmacılar, hamle ve sonuçlar arasındaki korelasyonu bulmaya çalışarak performansı arttıran 25 farklı makine öğrenmesi algoritmasını test ettiler.

Hiçbir algoritma işbirliği yapamadığı için bilim insanları hayal kırıklığına uğradı. Fakat evrimsel biyolojiden ilham aldılar ve insanlar arası işbirliğinin anahtar elementi olan iletişim becerisi niçin kullanılmasın ki, diye düşündüler. Böylelikle “Stratejimi değiştiriyorum.”, “Son teklifini kabul ediyorum.”, “Bana ihanet ettin!” gibi oyuncular arasında söylenen, önceden yazılmış 19 cümleyi oyuna eklediler. Bilgisayarlar zamanla öğrenme algoritmaları sayesinde oyunun içeriğine uygun olarak bu cümlelerin anlamlarını keşfetti.

Bu kez, bu 25 algoritmadan S# adı verileni (S sharp şeklinde okunuyor) öne çıktı. Bu algoritma, önceden bilinmeyen bir oyun hakkında bilgi verildiğinde birkaç turda partneri ile iş birliği yapmayı öğrendi. Oyunun sonuna gelindiğinde ise sadece makinelerin olduğu takımlar oyunun tamamında birlikte çalışırken, insanlar sadece %60’lık kısımda iş birliği yaptılar.

Böylesi bir bağlılık özerk otomobiller ve insansız uçaklarda karar vermeyi öğrenen algoritmaların yararına olabilir. İsveç’teki KTH Kraliyet Teknoloji Enstitüsü’nde robot bilimci olarak çalışan Danica Kragic, “İş birliği pek çok yapay zekâ araştırmasının temel amacı değildir. Bunun yerine, çoğu çalışma, yüz tanımadan poker oynamaya kadar, insanlara üstün gelen otonom teknolojiler geliştirmeye odaklanmıştır. ” diyor. Crendall ise, “Makineler yarışmaktan ötesini yapmalıdır. Robot bilimindeki çalışmalar yapay zekânın ilerlemesine yardımcı modeller olabilir.” şeklinde ekliyor.

Kaynak: http://www.sciencemag.org/news/2017/03/computers-learn-cooperate-better-humans

0 yorum