Son birkaç haftadır yapay zekâ dünyası, yapay zekânın insanlığın sonunu getireceğini iddia eden Elon Musk’un kurduğu ve desteklediği OpenAI şirketinin ürettiği GBT-3 isimli yapay zekâ uygulamasını konuşuyor.
GBT (Generative Pretrained Transformer) insanlara benzeyen cümleler kurup, verilen bir atasözü üzerine 2 sayfa kompozisyon yazıp ve çok sofistike sözlerle, çok güzel şiirler üretebiliyor. Atasözü ve özlü sözlere benzer güzel cümleler kurabiliyor. Aynı zamanda kendisine iş tanımını verdiğinizde o işi yapan bilgisayar programını üretip size bir kaç milisaniyede teslim edebiliyor. Hatta cep telefonunuzda çalışmak üzere resimleri işleyen, güzelleştiren ve sınıflandıran bir uygulama istiyorsunuz ve GBT-3 bunu size anında üretiyor. Mesela “bana çilek şeklinde bir buton yap, rengi koyu kırmızı olsun” diyorsunuz. GBT-3 bir saniye geçmeden butonu oluşturuyor ve gerekli HTML ve CSS kodunu üretiyor. Siz de kodu kopyalayıp web sitenizde kullanabiliyorsunuz. Öyleki Siri, Alexa, Google Home gibi kişisel asistanlar GBT-3’ün yanında bebek kalıyorlar.
İnsanlık her saniye büyük miktarda dijital veri üretmeye ve bunları kaydetmeye devam ediyor. Eskiden veri depolama üniteleri çok pahalı idi ve sadece çok önemli bilgiler kaydedilirdi. Şimdi ise veri kaydetme birimlerinin ucuzlaması, bilgisayarların hızlanması ve geçen haftaki
yazımızda derinlemesine anlattığımız bulut bilişimin gelişmesiyle artık veri depolamak çok ucuz. Aynı zamanda veri çok değerli. Bilişim dünyasıyla içli dışlı olanların çok iyi bildiği gibi bu çağda petrolün yerini büyük veri alıyor. Ayrıca veriler artık veri tabanında tutulan tablolar, satır ve sütunlardan ibaret değil. Veritabanında veya excel tablolarında tutulan verilere yapılandırılmış veri(structured data), tablolar halinde tutamadığımız karmaşık verilere de yapılandırılmamış veri (unstructured data) diyoruz. Resimler, videolar, ses dosyaları, web siteleri, e-postalar, PDF dokümanları, kitaplar, dergiler, bloglar, sözleşmeler, sosyal medya paylaşımları, ders notları ve doktorların hastaları hakkında tuttukları raporlar yapılandırılmamış veriye örnek gösterilebilir. Gerçekte şu an elimize mevcut verilerin yaklaşık %75’i yapılandırılmamış veridir ve bu veriler herhangi bir tabloya sığamayacak kadar karmaşıktır.
Mesela bir fotoğrafı veya videoyu düşünelim. Bir videoyu tablo olarak nasıl saklayacağız ya da bir fotoğrafı? Yada bir elektronik postayı ele alalım. Kimin, ne zaman, ne yazacağını bilemeyiz. Ve bu metinlerin hangi trendi takip ettiklerini göremeyiz. Her gün milyonlarca çok önemli ve kritik bilgilerin olduğu elektronik posta gönderiliyor. Fakat bu e-postaların çoğunu bir veritabanında tutmak karmaşık bir mevzudur. Web sitelerinin ise takip ettikleri bir standart yoktur. Herkes istediği tasarımı yapmakta ve istediği kadar yazı, resim ve video eklemektedir. Hal böyle olunca elimizdeki verinin %75’i yapılandırılmamış veridir ve bu verileri standart programlama dilleri ile programlamak,
kullanılabilir hale getirmek ve veri analizi yapmak çok zorlaşmaktadır.
Ancak yapay zekânın bir kolu olan Doğal Dil İşleme (Natural Language Processing) tam da bu iş için vardır. Doğal Dil İşleme (NLP) bilgisayarların yazılan metinlerin içeriğini anlaması ve ona göre cevap vermesi, sesli komutların yazıya çevrilmesi ve metin üretilmesi demektir. Doğal Dil İşleme verilen metinleri bir dilden başka bir dile çeviri yapabildiği gibi bir anda birçok dile de çevirebilir. Biz NLP’yi bilgisayarlarla insanların daha kolay iletişim kurması için kullanıyoruz. Bilgisayarlara erişmek ve onlarla iletişim kurmak için kullandığımız klavye ve fareye bağlı kalmamamız gerektiğini ve bu iletişimin çok daha basit bir çözümü olması gerektiğini düşünüyoruz. Bu sebeple bilgisayarları, Nesnelerin İnterneti ile akıllı cihazları, ve robotları harekete geçirecek komutun klavyeden yazarak değil değil konuşarak verilmesini istiyoruz.
yük bir ilerleme kaydederek yapılandırılmamış verileri modellerini eğitmek için kullandılar. Wikipedia’da bulunan 309 dilde, 29 milyar kelime, milyonlarca kitap ve milyonlarca web sitesinden milyarlarca kelime kullanıldı. Bu veri öylesine büyüktü ki modeli eğitmek için tam 175 milyar parametre kullanıldı. Bu modelleri eğitmek 4.6 milyon dolara mal oldu. Sonuçlar ise inanılmaz derecede başarılı idi. Bu sonuçlar bize daha önce hiç işlenemeyen yapılandırılmamış veriler modellere eğitim için verildiğinde, yeterli veriniz varsa çözülemeyecek problemin kalmayacağını gösteriyor. GBT-3 şu an OpenAI web sitesinden başvuru formu dolduranlara verilen API ile deneme maksatlı kullanıma izin veriyor. Ben de başvurdum fakat henüz onaylanmadı. Fakat geçtiğimiz hafta yapay zekâ toplulukları hep GBT-3’ün başarılarını konuştu ve sosyal medya yapay zekâ ürünü şiirler, kompozisyonlar, web site tasarımları, HTML ve CSS kodları, ve İngilizce dili ile yazılan emirleri algılayıp sözle tanımlanan programların kodları ile dolup taştı.Bir kaç satır sözle arama motoru yapanlar, sorulan sorulara akıllı bir insanın vereceği cevaplardan hiç farkı olmayan cevaplar hafta boyunca paylaşıldı. Hatta Linux işletim sistemindeki shell komutlarını bile düz İngilizce ile yazıyorsunuz, GBT-3 size gerekli shell komutunu bulup çalıştırıyor ve bunu çok yüksek doğruluk oranı ile yapıyor. Yazdığı şiirler normal bir şairi aratmayacak cinsten ve çok gerçekçi. Eksik kelimeleri ve cümleleri tamamlayabildiği gibi eksik resimlerdeki pikselleri de tahmin edebiliyor.
GBT-3 daha önceki versiyonlarından çok daha başarılı. Çünkü kullanılan veri miktarı milyarlarca parametre artırıldı ve daha güçlü bilgisayarlar kullanıldı. Eğer insan beynindeki nöron sayısı kadar parametre kullanılırsa bu başarıların daha da artacağı aşikâr. Bu durumda makinelerin insanlar kadar akıllı ve güzel sözler üretebileceğine şahit oluyoruz ve olacağız.
GBT-3 ile böylece yapay zekânın bilgisayar mühendisleri ve programcılarının yaptığı işleri yapabilir duruma geldiğini ve bilgisayar programcılığının altın çağını artık yitirdiğini görüyoruz. Bilgisayar programcıları henüz işsiz kalmayacak fakat zamanla değer kaybedecek. OpenAI şirketi bu yıl sonunda bu ürünü API üzerinden belirli bir ücret karşılığı ile isteyen şirketlerin kullanımına açacak. Kullanım için izin verildiğinde ben de yapay zekâya Türkiye Ekonomisinin nasıl düzeltilebileceğini soracağım.