Yapay zeka insanlıktan anlar mı?
Kendimi tanımlarken iftiharla kullandığım “uslanmaz bir öğrenci” tabiri pek çok arkadaşımın dikkatini çekiyor, haliyle de sebebini soruyorlar. Arz edeyim efendim, 38 yıllık ömrümün 31 yılını, bilfiil öğrenci olarak geçirdiğim için gönül rahatlığı ile bu tabiri kullanıyorum. Fakat yine de iyi bir öğrenci olduğumu söyleyemeyeceğim.
Üniversite hayatım 2000’li yılların başlangıcında, İstanbul Üniversitesi Edebiyat Fakültesi’nde başladı. Ben her ne kadar bildiğimi okuduğumu söylesem de kayıtları kurcalayanlar, öğrencisi olduğum bölümün Coğrafya olduğunu göreceklerdir. Büyük bir arzu ile, tercih listesinin en başına yazdığım bu bölümü maalesef bitiremedim. Ama tadı dimağımda kalan fevkalade anılarım oldu.
Bunlardan biri, hocalarımızdan birinin her hafta bir akademik makale okuma ödevi vermeseydi. Her hafta kütüphanenin yolunu aşındırır, makalenin olduğu dergiyi kitaplıktan ödünç alır, okuduktan sonra geri teslim ederdik. Bunu kaç kişi yapıyordu bilmiyorum, ama bendeniz pek bir keyif alarak bu vazifeyi ifa ediyor idim.
Akademik makalelerin takibatına bu ciddiyetle devam edemesem de Google Scholar başta olmak üzere akademik pek çok e-posta listesine, ilgilendiğim başlıklarda abone olmaktan kendimi alamıyorum. Gelen makalelerin zamanım varsa özet kısmına, hiç değilse anahtar kelimelerine göz atmak, beni 18 yaşımın o başında kavak yelleri esen, meraklı günlerine her defasında tekrar tekrar götürüyor.
Bir süredir ilgilendiğim akademik çalışmaların anahtar kelimelerine Geniş Dil Modelleri - Large Language Models’in baş harflerinden müteşekkil LLM ‘i de ekledim bile.
Bu hafta payıma “Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4” başlıklı makale düştü. "All You Need" geniş dil modelleri söz konusu olduğunda ortak bir nükteye dönüşmüş durumda. Zira 2017 yılında yayınlanan, dil modellerinin bel kemiğini oluşturan Transfermorslerın dünyaya merhaba dediği makalenin başlığı "Attention is all you need" idi.
VILA Lab ve Mohammed Zayd Yapay Zeka Üniversitesi’nden araştırmacıların ortaklaşa hazırladıkları çalışmada yapay zeka dil modellerinden daha iyi sonuçlar almak için, promptlarınızı iyileştirebileceğiniz 26 temel prensip paylaşılıyor.
Prompt, yapay zeka dil modellerine, örneğin ChatGPT, verdiğimiz talimatların, sorduğumuz soruların genel adı. Makalenin girişinde de atıf yapıldığı gibi yakın bir zamanda OpenAI şirketi tarafından yayınlanan prompt rehberinde prompt verme becerisi bir sanat olarak adlandırılıyor. Hatta prompt engineering bugünün en popüler "skill"lerinden.
OpenAI genel olarak 6 başlıkta nasıl daha iyi prompt verileceğini, genel anlamda özetlemiş olsa da zikredilen çalışmada 26 prensip adeta OpenAI’ın çizdiği çerçevenin içini bir güzel tarıyor.
Araştırmada madde madde sıralanan prensiplerde birinci madde hususen gözüme çarptı. Araştırmacılar yapay zeka dil modellerine talimat verirken kibarlıktan kırılmaya hiç gerek olmadığını söylüyor. Edeb ya hu!
Bir an düşündüm, gayrı ihtiyari neredeyse bütün promptlarıma bendeniz de “lütfen” kelimesi ile başlıyor, yapay zeka dil modelinden bir şey isterken karşısında ezilip büzülüyorum. Araştırmacılar ise buna gerek olmadığını söylüyorlar.
Fakat enteresan olan şu ki araştırmacıların bulgularına göre kibarlıktan, beyefendilikten anlamayan yapay zeka dil modelleri kötek görünce hizaya geçiyor, cezalandırılacaklarını ya da ödüllendirileceklerinin söylendiği promptlarda daha iyi çıktılar üretiyorlar.
Daha önce başka araştırmalarda yapay zeka dil modelleri duygusal olarak baskı altına alındığında, örneğin işi bihakkın tamamlayamazsanız işinizden kovulacağınızı söylerseniz, sizin için daha iyi sonuçlar ürettiği söyleniyor.
Hasılı benim makaleden anladığım büyük dil modellerinin pek de öyle insanlıktan anlamadığı yönünde.
Fakat bana sorarsanız siz yine de teşekkür etmekten, minnettarlık belirtmekten vazgeçmeyin sevgili okurlar.
Zira bu süreçte, sadece biz dil modellerinden öğrenmiyoruz; dil modelleri de bizden öğrenmeye devam ediyor. İnanmayan ChatGPT'nin kullanıcı sözleşmesini okusun.
İnancım odur ki yılanı deliğinden çıkaran tatlı dil; beklediğiniz doğru yanıtı milyarlarca parametrenin derinliklerinden de çıkaracaktır.
Makaleyi okumak isterseniz, şuradan buyrun efendim: [2312.16171] Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4 (arxiv.org)