Yapay zekâ (YZ), insan zekasının bazı yönlerini sergileyen herhangi bir teknolojiyi ifade eder ve onlarca yıldır bilgisayar bilimlerinde öne çıkan bir alan olmuştur. YZ görevleri, görsel bir sahnedeki nesneleri seçmekten bir cümlenin nasıl çerçeveleneceğini bilmeye ve hatta hisse senedi fiyat hareketlerini tahmin etmeye kadar her şeyi içerebilir.
Bilim insanları, bilgisayar çağının başlangıcından bu yana YZ oluşturmaya çalışıyorlar. Geçen yüzyılın büyük bir bölümünde önde gelen yaklaşım, gerçekler ve kurallardan oluşan büyük veri tabanları oluşturmak ve daha sonra mantık tabanlı bilgisayar programlarının karar vermek için bunlardan yararlanmasını sağlamaktı. Ancak bu yüzyılda, bilgisayarların verileri analiz ederek kendi gerçeklerini ve kurallarını öğrenmelerini sağlayan yeni yaklaşımlarla bir değişim yaşandı. Bu da alanda büyük ilerlemelere yol açtı.
Geçtiğimiz on yıl içinde makineler, tıbbi görüntülerde meme kanserini tespit etmekten, şeytani derecede zor masa oyunları Satranç ve Go oynamaya ve hatta proteinlerin yapısını tahmin etmeye kadar her konuda görünüşte "insanüstü" yetenekler sergiledi.
Büyük dil modeli (LLM) sohbet robotu ChatGPT'nin 2022'nin sonlarında sahneye çıkmasından bu yana, yapay genel zekâ (AGI) olarak bilinen, insanlarda görülene benzer daha genel zekayı kopyalamanın eşiğinde olabileceğimize dair artan bir fikir birliği de var. Yapay zeka şirketi Cohere tarafından kurulan ve kar amacı gütmeyen bir araştırma laboratuvarı olan Cohere For AI'nin başkanı Sara Hooker, "Bunun alan için ne kadar önemli bir değişim olduğu gerçekten vurgulanamaz" dedi.
Yapay zekâ nasıl çalışır?
Bilim insanları YZ sistemleri oluşturmak için birçok yaklaşım benimseyebilirken, makine öğrenimi günümüzde en yaygın kullanılanıdır. Bu, daha sonra tahminler yapmak için kullanılabilecek kalıpları tanımlamak için bir bilgisayarın verileri analiz etmesini içerir.
Öğrenme süreci, bilgisayara verileri nasıl analiz edeceğini söyleyen ve insanlar tarafından yazılan bir dizi talimat olan bir algoritma tarafından yönetilir ve bu sürecin çıktısı, keşfedilen tüm kalıpları kodlayan istatistiksel bir modeldir. Bu model daha sonra tahminler üretmek için yeni verilerle beslenebilir.
Birçok türde makine öğrenimi algoritması mevcuttur, ancak nöral ağlar günümüzde en yaygın kullanılanlar arasındadır. Bunlar, insan beyni üzerinde gevşek bir şekilde modellenmiş makine öğrenimi algoritmaları koleksiyonlarıdır ve eğitim verilerini tararken "yapay nöronlar" ağı arasındaki bağlantıların gücünü ayarlayarak öğrenirler. Bu, metin ve görüntü oluşturucular gibi günümüzün en popüler yapay zekâ hizmetlerinin çoğunun kullandığı mimaridir.
Günümüzün en ileri araştırmaları, çok sayıda yapay nöron katmanına sahip çok büyük nöral ağlarının kullanılması anlamına gelen derin öğrenmeyi içermektedir. Bu fikir 1980'lerden beri kullanılıyordu ancak devasa veri ve hesaplama gereksinimleri uygulamaları sınırlıyordu. Daha sonra 2012 yılında araştırmacılar, grafik işleme birimleri (GPU'lar) olarak bilinen özel bilgisayar çiplerinin derin öğrenmeyi hızlandırdığını keşfetti. Derin öğrenme o zamandan beri araştırmalarda altın standart haline geldi.
Hooker, "Derin nöral ağları, steroidler üzerinde bir tür makine öğrenimi" dedi. "Hem hesaplama açısından en pahalı modeller, hem de tipik olarak büyük, güçlü ve etkileyici"
Ancak tüm nöral ağlar aynı değildir. Farklı konfigürasyonlar ya da bilinen adıyla "mimariler" farklı görevler için uygundur. Konvolüsyonel nöral ağları, hayvan görsel korteksinden esinlenen bağlantı modellerine sahiptir ve görsel görevlerde mükemmeldir. Bir tür dahili belleğe sahip olan tekrarlayan nöral ağları, sıralı verileri işleme konusunda uzmanlaşmıştır.
Algoritmalar da uygulamaya bağlı olarak farklı şekilde eğitilebilir. En yaygın yaklaşım "denetimli öğrenme" olarak adlandırılır ve insanların örüntü öğrenme sürecini yönlendirmek için her bir veri parçasına etiket atamasını içerir. Örneğin, kedi görüntülerine "kedi" etiketini eklersiniz.
"Denetimsiz öğrenmede" eğitim verileri etiketsizdir ve makinenin kendi kendine bir şeyler bulması gerekir. Bu çok daha fazla veri gerektirir ve çalışması zor olabilir- ancak öğrenme süreci insan önyargıları tarafından kısıtlanmadığı için daha zengin ve daha güçlü modellere yol açabilir. LLM'lerdeki son atılımların çoğu bu yaklaşımı kullanmıştır.
Son büyük eğitim yaklaşımı, bir yapay zekanın deneme yanılma yoluyla öğrenmesini sağlayan "pekiştirmeli öğrenme "dir. Bu en yaygın olarak oyun oynayan yapay zeka sistemlerini veya robotları (Şekil 01 gibi insansı robotlar veya futbol oynayan bu minyatür robotlar dahil) eğitmek için kullanılır ve bir görevi tekrar tekrar denemeyi ve olumlu veya olumsuz geri bildirimlere yanıt olarak bir dizi dahili kuralı güncellemeyi içerir. Bu yaklaşım Google Deepmind'ın çığır açan AlphaGo modeline güç vermiştir.
Üretken yapay zekâ nedir?
Derin öğrenme son on yılda bir dizi büyük başarı elde etmesine rağmen, çok azı ChatGPT'nin tekinsiz insani konuşma yetenekleriyle aynı şekilde halkın hayal gücünü yakaladı. Bu, metin, görüntü, ses ve hatta video dahil olmak üzere bir kullanıcının girdisine dayalı bir çıktı oluşturmak için derin öğrenme ve nöral ağlarını kullanan birkaç üretken yapay zekâ sisteminden biridir.
ChatGPT gibi metin oluşturucular, "doğal dil işleme" (NLP) olarak bilinen bir yapay zekâ alt kümesini kullanarak çalışır. Bu atılımın kökeni, Google bilim insanları tarafından 2017 yılında tanıtılan ve "transformer" adı verilen yeni bir derin öğrenme mimarisine dayanıyor.
Transformatör algoritmaları, büyük sıralı veri koleksiyonları- özellikle de büyük yazılı metin yığınları- üzerinde denetimsiz öğrenme gerçekleştirme konusunda uzmanlaşmıştır. Bunu yapmakta başarılılar çünkü uzak veri noktaları arasındaki ilişkileri önceki yaklaşımlardan çok daha iyi izleyebiliyorlar, bu da baktıkları şeyin bağlamını daha iyi anlamalarını sağlıyor.
Hooker, "Bundan sonra söyleyeceklerim daha önce söylediklerime dayanıyor- dilimiz zamanla bağlantılıdır" dedi. "Bu, kelimeleri bir bütün olarak görebilme yeteneği, en önemli buluşlardan biriydi."
LLM'ler, bir cümledeki bir sonraki kelimeyi maskeleyerek öğrenir ve daha önce gelenlere dayanarak bunun ne olduğunu tahmin etmeye çalışır. Eğitim verisi zaten cevabı içerdiğinden, yaklaşım herhangi bir insan etiketlemesi gerektirmez, bu da internetten veri yığınlarını kazıyıp algoritmaya beslemeyi mümkün kılar. Dönüştürücüler ayrıca bu eğitim oyununun birden fazla örneğini paralel olarak gerçekleştirebilir, bu da verileri çok daha hızlı bir şekilde çalkalamalarına olanak tanır.
Bu kadar büyük miktarda veri üzerinde eğitim yaparak, dönüştürücüler insan dilinin son derece sofistike modellerini üretebilir- dolayısıyla "büyük dil modeli" takma adı. Ayrıca, bir insanın üretebileceği metne çok benzeyen karmaşık, uzun biçimli metinleri analiz edebilir ve üretebilirler. Dönüştürücülerin devrim yarattığı tek şey dil değil. Aynı mimari paralel olarak metin ve görüntü verileri üzerinde de eğitilebiliyor ve sonuçta basit bir yazılı açıklamadan yüksek çözünürlüklü görüntüler üreten Stable Diffusion ve DALL-E gibi modeller ortaya çıkıyor.
Dönüştürücüler ayrıca Google Deepmind'ın amino asit dizilerinden protein yapıları üretebilen AlphaFold 2 modelinde de merkezi bir rol oynamıştır. Mevcut verileri basitçe analiz etmek yerine orijinal veri üretme yeteneği, bu modellerin "üretken YZ" olarak bilinmesinin nedenidir.
Dar YZ ve yapay genel zekâ (AGI): Aralarındaki fark nedir?
İnsanlar, gerçekleştirebilecekleri görevlerin genişliği nedeniyle YZY'ler konusunda heyecan duymaya başladılar. Çoğu makine öğrenimi sistemi, bir video akışındaki yüzleri tespit etmek veya bir dilden diğerine çeviri yapmak gibi belirli bir sorunu çözmek için eğitilir. Bu modeller "dar yapay zekâ" olarak bilinir çünkü yalnızca eğitildikleri belirli görevin üstesinden gelebilirler.
Çoğu makine öğrenimi sistemi, belirli bir problemi (video akışındaki yüzleri tespit etmek veya bir dilden diğerine çeviri yapmak gibi) insanüstü bir seviyede çözmek için eğitilir, böylece çok daha hızlıdırlar ve bir insanın yapabileceğinden daha iyi performans gösterirler. Ancak ChatGPT gibi LLM'ler, tek bir modelin çok çeşitli görevleri yerine getirebilmesi nedeniyle yapay zekâ yeteneklerinde bir adım değişikliği temsil ediyor. Farklı konulardaki soruları yanıtlayabilir, belgeleri özetleyebilir, diller arasında çeviri yapabilir ve kod yazabilirler.
Öğrendiklerini birçok farklı sorunu çözmek için genelleştirebilme yeteneği, geçen yıl yayınlanan bir makalede DeepMind bilim adamları da dahil olmak üzere bazılarının LLM'lerin AGI'ye doğru bir adım olabileceği spekülasyonuna yol açtı. AGI, bir insanın yapabileceği herhangi bir bilişsel görevde ustalaşabilen, sorunlar hakkında soyut bir şekilde akıl yürütebilen ve özel bir eğitim almadan yeni durumlara uyum sağlayabilen varsayımsal bir gelecekteki yapay zekayı ifade eder.
YZ meraklıları, YZ'ye ulaşıldığında teknolojik ilerlemenin hızla hızlanacağını ve "tekillik" olarak bilinen bir dönüm noktasından sonra atılımların katlanarak gerçekleşeceğini öngörüyor. Ayrıca, büyük ekonomik ve işgücü piyasası bozulmalarından YZ'nin yeni patojenler veya silahlar keşfetme potansiyeline kadar uzanan varoluşsal riskler de algılanmaktadır.
Ancak LLM'lerin bir AGI'nin öncüsü mü yoksa AGI için gerekli olan daha geniş bir ağ veya YZ mimarileri ekosisteminde sadece bir mimari mi olacağı konusunda hala tartışmalar var. Bazıları LLM'lerin insan muhakemesini ve bilişsel yeteneklerini taklit etmekten kilometrelerce uzak olduğunu söylüyor. Muhaliflere göre, bu modeller sadece büyük miktarda bilgiyi ezberlemiş ve bunları daha derin bir anlayış izlenimi verecek şekilde yeniden birleştirmişlerdir; bu, eğitim verileriyle sınırlı oldukları ve diğer dar YZ araçlarından temelde farklı olmadıkları anlamına gelir.
Bununla birlikte Hooker, LLM'lerin bilim insanlarının yapay zekâ geliştirmeye yaklaşımında sismik bir değişimi temsil ettiğinin kesin olduğunu söyledi. Modelleri belirli görevler üzerinde eğitmek yerine, en yeni araştırmalar artık bu önceden eğitilmiş, genel olarak yetenekli modelleri alıyor ve bunları belirli kullanım durumlarına uyarlıyor. Bu da modellerin "temel modeller" olarak anılmasına yol açtı.
Hooker, "İnsanlar sadece tek bir şey yapan çok özel modellerden, her şeyi yapan bir temel modele geçiyorlar" diye ekledi. "Bunlar her şeyin üzerine inşa edildiği modeller."
Yapay zekâ gerçek dünyada nasıl kullanılıyor?
Makine öğrenimi gibi teknolojiler her yerde. Yapay zekâ destekli öneri algoritmaları Netflix veya YouTube'da ne izleyeceğinize karar verirken, çeviri modelleri bir web sayfasını yabancı bir dilden kendi dilinize anında dönüştürmeyi mümkün kılıyor. Bankanız da muhtemelen hesabınızda dolandırıcılığa işaret edebilecek olağandışı faaliyetleri tespit etmek için yapay zekâ modellerini kullanıyordur ve güvenlik kameraları ve sürücüsüz arabalar, video akışlarından insanları ve nesneleri tanımlamak için bilgisayarla görme modellerini kullanır.
Ancak üretken YZ araçları ve hizmetleri, ChatGPT gibi yeni sohbet robotlarının ötesinde gerçek dünyaya girmeye başlıyor. Çoğu büyük YZ geliştiricisi artık kullanıcıların çeşitli konulardaki sorularını yanıtlayabilen, belgeleri analiz edip özetleyebilen ve diller arasında çeviri yapabilen bir sohbet robotuna sahip. Bu modeller aynı zamanda arama motorlarına da entegre ediliyor- Google Arama'ya Gemini gibi- ve şirketler ayrıca programcıların kod yazmasına yardımcı olan Github Copilot gibi yapay zekâ destekli dijital asistanlar da geliştiriyor. Hatta kelime işlemci veya e-posta istemcisi kullanan kişiler için üretkenliği artıran bir araç bile olabilirler.
Chatbot tarzı yapay zekâ araçları en yaygın olarak bulunan üretken yapay zekâ hizmetidir, ancak etkileyici performanslarına rağmen LLM'ler hala mükemmel olmaktan uzaktır. Belirli bir soruyu hangi kelimelerin takip etmesi gerektiği konusunda istatistiksel tahminlerde bulunurlar. Genellikle anlamayı gösteren sonuçlar üretmelerine rağmen, "halüsinasyon" olarak bilinen makul ancak yanlış cevapları da güvenle üretebilirler.
Üretken yapay zekâ giderek yaygınlaşırken, bu araçların en çok nerede ve nasıl faydalı olacağı henüz netlik kazanmış değil. Hooker, teknolojinin ne kadar yeni olduğu göz önüne alındığında, ne kadar hızlı kullanıma sunulacağı konusunda temkinli olmak için nedenler olduğunu söyledi. "Bir şeyin teknik olasılıkların sınırında olması ama aynı zamanda yaygın olarak kullanılması çok alışılmadık bir durum" diye ekledi. "Bu da kendi risklerini ve zorluklarını beraberinde getiriyor."
Bu yazı LIVESCIENCE’ de yayınlanmıştır.
0 yorum