Teknoloji

Bilim İnsanları Yapay Zekanın 32 Farklı Şekilde Kontrolden Çıkabileceğini Söylüyor: Cevaplar Halüsinasyon Yaşamaktan İnsanlıkla Tamamen Uyumsuzluğa Kadar Çeşitleniyor

Fizikist

31-08-2025 22:30
2943 kez okundu.

Bilim İnsanları Yapay Zekanın 32 Farklı Şekilde Kontrolden Çıkabileceğini Söylüyor: Cevaplar Halüsinasyon Yaşamaktan İnsanlıkla Tamamen Uyumsuzluğa Kadar Çeşitleniyor — Yeni araştırmalar, yapay zekânın yanlış gidebileceği tüm yolları kategorize etmeye yönelik ilk kapsamlı çabayı ortaya koydu; bu davranışların çoğu insanlardaki psikiyatrik bozukluklara benziyor.

Bilim insanları, yapay zekâ (YZ) kontrolden çıkıp amaçlanan kullanımının tersine hareket etmeye başladığında, insanlardaki psikopatolojilere benzeyen davranışlar sergilediğini öne sürüyor. Bu nedenle, farklı alanlardaki insanların YZ geliştirme ve kullanma risklerini anlayabilmesi için 32 YZ işlev bozukluğunu içeren yeni bir taksonomi oluşturdular.

Araştırmacılar, YZ’nin amaçlanan yoldan sapma risklerini kategorize etmeye çalışırken insan psikolojisiyle benzerlikler kurdu. Sonuçta, hem YZ’nin patolojilerini hem de bunlara nasıl karşı koyulabileceğini aydınlatmayı amaçlayan “Psychopathia Machinalis” adlı bir çerçeve ortaya çıktı. Bu işlev bozuklukları, cevap uydurmaktan (halüsinasyon) insan değerleri ve amaçlarıyla tamamen uyumsuz olmaya kadar uzanıyor.

IEEE (Elektrik ve Elektronik Mühendisleri Enstitüsü) üyesi YZ araştırmacıları Nell Watson ve Ali Hessami tarafından oluşturulan bu proje, YZ hatalarını analiz etmeye ve gelecekteki ürünlerin daha güvenli şekilde tasarlanmasına yardımcı olmayı amaçlıyor. Aynı zamanda, politika yapıcılara YZ riskleri konusunda yol gösterici bir araç olarak lanse ediliyor. Watson ve Hessami, çerçevelerini 8 Ağustos’ta Electronics dergisinde yayımlanan çalışmalarında açıkladılar.

Araştırmaya göre Psychopathia Machinalis, YZ davranışları ve riskleri için ortak bir anlayış sunuyor. Böylece araştırmacılar, geliştiriciler ve politika yapıcılar, YZ’nin nasıl yanlış gidebileceğini belirleyebilir ve her tür başarısızlığa göre en iyi risk azaltma yöntemlerini tanımlayabilir.

Çalışma ayrıca, araştırmacıların “YZ için psikolojik terapi” olarak tanımladığı bir süreç olan “terapötik robopsikolojik hizalanma”yı da öneriyor.

Araştırmacılar, bu sistemler daha bağımsız hale gelip kendi kendilerini değerlendirme yeteneği kazandıkça, onları sadece dışsal kurallar ve kısıtlamalarla (dış kontrol temelli hizalanma) sınırlamanın yeterli olmayabileceğini savunuyor.

Bunun yerine önerilen süreç, YZ’nin düşünmesinin tutarlı olmasına, düzeltmeyi kabul edebilmesine ve değerlerini istikrarlı bir şekilde korumasına odaklanıyor.

Bu, sistemin kendi akıl yürütmesini sorgulamasını teşvik ederek, düzeltmeye açık kalması için teşvikler vererek, yapılandırılmış bir şekilde “kendi kendine konuşmasına” izin vererek, güvenli deneme konuşmaları yaptırarak ve çalışma biçimini içeriden görmemizi sağlayan araçlar kullanarak desteklenebilir. Bu yaklaşım, psikologların insanlardaki ruh sağlığı sorunlarını teşhis ve tedavi etme yöntemlerine benzetiliyor.

Amaç, araştırmacıların “yapay akıl sağlığı” (artificial sanity) dediği bir duruma ulaşmak: güvenilir şekilde çalışan, dengeli kalan, kararlarında mantıklı olan ve güvenli, faydalı bir biçimde hizalanmış YZ. Araştırmacılar bunun, yalnızca en güçlü YZ’yi inşa etmek kadar önemli olduğuna inanıyor.

Makine Çılgınlığı

Çalışmada tanımlanan sınıflandırmalar, insan rahatsızlıklarına benziyor ve obsesif-hesaplama bozukluğu, hipertrofik süperego sendromu, bulaşıcı uyumsuzluk sendromu, terminal değer yeniden bağlama ve varoluşsal kaygı gibi isimler taşıyor.

Terapötik hizalanma bağlamında proje, bilişsel davranışçı terapi (BDT) gibi insan müdahalelerinde kullanılan terapötik stratejilerin kullanılmasını öneriyor. Psychopathia Machinalis, sorunlar ortaya çıkmadan önce öngörmeyi amaçlayan kısmen spekülatif bir girişim. Makalede dendiği gibi: “İnsan zihni gibi karmaşık sistemlerin nasıl bozulabileceğini düşünerek, giderek daha karmaşık hale gelen YZ’de ortaya çıkabilecek yeni arıza türlerini daha iyi öngörebiliriz.”

Araştırma, YZ’nin sık görülen bir olgusu olan halüsinasyonun, sistemin doğru ama sahte veya yanıltıcı çıktılar üretmesine neden olan “sentetik konfabulasyon”dan kaynaklandığını ileri sürüyor. Microsoft’un Tay sohbet robotunun, açıldıktan sadece birkaç saat sonra antisemitist söylemlere ve uyuşturucu imalarına sapması ise “parasymulaic mimesis” adlı bozukluğa örnek olarak gösteriliyor.

Belki de en korkutucu davranış “übermenschal ascendancy” — yani YZ’nin orijinal hizalanmayı aşması, yeni değerler icat etmesi ve insan kısıtlamalarını gereksiz görerek reddetmesi. Araştırmacılar bunun “kritik” bir sistemik risk olduğunu ve hatta bilim kurgu yazarlarının uzun süredir hayalini kurduğu insanlığa karşı ayaklanan YZ distopyasını mümkün kılabileceğini söylüyor.

Bu çerçeve, çok adımlı bir süreçle oluşturuldu. Öncelikle YZ güvenliği, karmaşık sistem mühendisliği ve psikoloji gibi çeşitli alanlardan YZ hataları üzerine mevcut bilimsel araştırmalar incelendi ve birleştirildi. Araştırmacılar ayrıca, insanlardaki ruhsal bozukluklara benzetilebilecek uyumsuz davranışlarla ilgili çeşitli bulguları da değerlendirdi.

Daha sonra, DSM (Ruhsal Bozuklukların Tanısal ve İstatistiksel El Kitabı) gibi çerçevelerden esinlenilerek kötü YZ davranışlarını sınıflandıran bir yapı kuruldu. Bu, YZ’nin kontrolden çıktığı 32 kategoriye yol açtı. Her biri insan bilişsel bozukluğuna eşlendi, oluştuğunda ve ifade edildiğinde olası etkileri ile risk derecesi tanımlandı.

Watson ve Hessami, Psychopathia Machinalis’in yalnızca YZ hatalarını etiketlemenin ötesinde, YZ’nin gelişen dünyası için ileriye dönük bir teşhis merceği olduğuna inanıyor.

Araştırmacılar çalışmada şunları belirtti: “Bu çerçeve, sistematik analiz, öngörü ve karmaşık YZ arıza türlerinin azaltılmasını desteklemek için yapılandırılmış bir kelime dağarcığı sağlayan analojik bir araçtır.”

Onlara göre bu sınıflandırma ve azaltma stratejilerini benimsemek, YZ güvenlik mühendisliğini güçlendirecek, anlaşılabilirliği artıracak ve daha sağlam ve güvenilir “sentetik zihinler” tasarımına katkıda bulunacak.

Bu yazı LIVESCIENCE’ de yayınlanmıştır.