Yapay zekâ bizden zekiyse ne yaparız?

Geçen Kasım’da, OpenAI (Açık Yapay Zekâ) firmasının ChatGPT ürünü internete kondu. Ben buna ancak iki ay sonra uyanmıştım. https://www.karar.com/yazarlar/iskender-oksuz/yapay-zeka-ile-bir-kaynattik-bir-kaynattik-1595387

GPT, Birçok dilde konuşabildiğiniz, sohbet havasında sorular sorup cevap alabildiğiniz, ChatGPT’nin arkasındaki yapay zekâ yazılımının adı. GPT’nin açılımı, Generative Pre-Trained Transformer imiş. “Yaratıcı veya üretici, önceden eğitilmiş değiştirici” diye çevirebiliriz. Ocak’ta şiir tercüme ettirip size anlattığım yapay zekâ, işte bu GPT’nin 3,5 modeliydi.

Son birkaç günde GPT 4’ün çıktığını duydum. Ve hemen https://chat.openai.com adresine gittim. Zekâsı ilerlemiş mi, anlayayım, bir bakayım diye sordum: “ChatGPT’nin hangi versiyonuyla konuşuyorum?”. Cevap: “ChatGPT’de versiyon numarası yoktur.” Demek versiyon değişikliği alttaki yapay zekâda yapılıyor. Chat’da değil.

ÖNCEDEN EĞİTİLMİŞ

Ne olup bittiğini anlamak istedim. Siz olsanız kime sorarsınız? Yine kendisine sordum. Cevabı beni eğitti. Mealen, “Benim bilgilenme kesim tarihim Eylül 2021’dir. Bu tarihte OpenAI’nin GPT-4 geliştirme planı açıklanmamıştı.” dedi. GPT’nin P’sindeki “önceden eğitilmiş”in ne anlama geldiğini şimdi daha iyi anladım. GPT-3.5, o önceden eğitiminin bitiş tarihinden sonraki gelişmelerden habersiz.

O bilmiyor ama ortalık GPT-4 haberleri ile kaynıyor. Yazılımlarda “open” yani “açık” kelimesi bedava, amatörce anlamına kullanılır. Linux gibi dev yazılımlar hep amatörlerce geliştirildi. OpenAI’den de normalde beklenen budur ama Microsoft ve diğer grupların on milyonlarca dolar yatırdıklarını biliyoruz. Dolayısıyla bu yazılım da “ açık” sayılmaz artık. Gerçekten, yukarıda verdiğim bağlantıya girerseniz sol altta, sizi yükseltmeye davet eden bir düğme var. Uzatmayayım: GPT-4’le çalışmak istiyorsanız ayda 20 dolar ödeyeceksiniz. Batılı için çok ucuz. Bizim kalkınmamakta olan ülkemiz sakinleri için o kadar ucuz değil.

Teknoloji öyle durup durup ani bir sıçrayışla ilerlemiyor. Adım adım, her adımda biraz daha, biraz daha iyileştirilerek zirveye tırmanıyor. GPT’nin açılımından başka bir ismi daha var: Büyük Lisan Modeli. 3,5’tan 4’e geçerken epey bir geliştirmişler; 4, artık şekilleri de algılıyor. Hâlbuki 3,5, sadece yazıdan anlıyordu.

GPT-4 NE KADAR DAHA AKILLI?

Yeni model, eskisine göre ne kadar daha iyi? En kestirme cevabı grafikle gösterebiliriz. Şekilde, ABD’deki çeşitli kurumlaşmış sınavlarda, iki versiyonun başarıları karşılaştırıyor. Burada lise biyoloji testinden, üniversite ve doktora giriş testlerine, avukatlık yapabilmek için geçilmesi gereken baro sınavına kadar belli başlı testler var. Her sınav bir sütun. Sütunlarda GPT versiyonlarının başarıları gösteriliyor. Dikey eksen, %0’dan %100’e kadar gidiyor. Anlamı şöyle: Eğer GPT sütunu %80’i gösteriyorsa bu sınavda GPT, insanların en iyi yüzde yirmisi kadar başarılıymış. Buna, GPT, insanların en iyi yüzde yirmisinin içinde de diyebilirsiniz. Sıralama GPT-3,5’taki başarılara göre yapılmış. O sütunların üstüne GPT-4 sonuçları eklenmiş. Bunların üstünde de ‘4’ün şekilden anlayan cinsinin ilave başarısı konmuş. https://openai.com/research/gpt-4

Şimdi birkaç sınava bakalım: Eski versiyonda en büyük başarı, AP-Environmental Sciencse Placement Test- İleri Seviye Çevre Bilimi Yerleştirme Sınavı’nda alınmış. Bizde olsa YÖK bunu, ÇBYS falan diye kısaltırdı. Bu, lise öğrencilerinin girdiği ve üniversite seviyesinde dersleri alıp alamayacaklarını belirleyen sınavlardan biri. Eski GPT’nin en başarılı olduğu sınav bu; GPT-3,5, lise öğrencilerinin en iyi yüzde onu arasına girmiş. O sütunun hemen solunda ve yeni versiyonun, eskiyi geçtiği SAT, Standart Başarı Sınavı, yani üniversiteye giriş için kullanılan sınav var. Dikkatinizi biraz sola kaydırırsanız en uzun sütunu görürsünüz. ABD lise öğrencilerinin girdiği, biyoloji olimpiyatı testi. GPT, hemen bütün insanlardan daha başarılı. Onun biraz sağında, neredeyse aynı seviyede, lisansüstü sözlü sınavı var. GPT, insanların neredeyse en üst %1-2’si içinde. Asıl sürpriz soldan beşinci sütunda. ABD baro sınavı. Burada yapay zekâ, insan avukat adaylarının yüzde 95’ini geride bırakıyor.

YA GPT-5 İŞİMİZİ ELİMİZDEN ALIR MI?

GPT, birinci sınıf dilekçeler yazabiliyor. Beklenen deney, kulaklık takmış bir avukatın, GPT’nin suflörlüğüyle mahkemede konuşması… İnsan avukatların, en iyi yüzde beşi arasında ya!

Bu sonuçlar çarpıcı muhakkak. Daha önce bazılarını duymuş olabilirsiniz. Fakat lütfen en önemli sonuca dikkat edin. GPT’nin 3,5 versiyonu ile 4 arasındaki farka. Mesela baro sınavında eski model en düşük yüzde ondaymış. Şimdi en yüksek yüzde onda! Gelişme bu hızla devam ederse hiç olmazsa sınavlarda yapay zekânın insanı geçeceği muhakkak gibi.

Bunun işlere, daha doğrusu işsizliğe ve ekonomiye, etkisi ne olur dersiniz?

İskender Öksüz

Yapay zekâ bizden zekiyse ne yaparız?