Dil modeli olan rol model olur
Zannediyorum 2017 yılı idi. Boğaziçi Üniversitesi’nde bir etkinliğe konuşmacı olarak davet edilmiş idim. Konferans bitiminde organizasyon sahiplerinin ikramları için yine kampüs içinde bir yerde oturmuş idik.
O esnada laf nereden açıldı ise, konu Birleşik Arap Emirlikleri'nde kurulan Yapay Zeka Bakanlığı’na geldi. Masadakilerden biri “Altyapıları var mı ki bakanlık kurmuşlar” deyince, ben de bir herzevekillik edip “Aman canım bizde de Adalet Bakanlığı yok mu” deyiverdim. Kısa bir sessizlikten sonra Allah’tan çay servisi ile birlikte konu hızlıca değişiverdi. Kurulan bakanlığa, bakan olarak atanan ilk isim o dönem 27 yaşındaki Omar Al Olama idi. Bugün açık olarak paylaşılan pek çok dil modelinin, örneğin LLama, ya da dil modeli kurulumlarının (Ollama) hâla bakanlık görevini sürdüren sayın Olama ile bir ilgisi yok. En azından ben öyle biliyorum.
Gel zaman, git zaman köprünün altından çok sular aktı tabii. Sabah erken kalkanın geniş dil modeli (LLM, Large Language Model) yayınladığı günlere geldik. Abu Dabi’den Falcon isimli geniş dil modeli, üstelik birkaç farklı versiyonu ile birlikte, 12 Eylül 2023 tarihinde ücretsiz ve açık olarak yayınlandı.
Bizim maalesef ülke olarak henüz bir dil modelimiz yok. Ücretsiz ve açık kaynak olarak yayınlanan modellerdeki Türkçe testleri çok başarılı sonuçlar vermiyor. Kapalı ve gelişmiş versiyonu ücretli olan bir OpenAI’ın GPT 3.4 ve 4 modelleri şu an Türkçe dilinde en iyi çıktıları üreten modeller. Onlar da pahalı, en iyi ihtimalle dışarıya bağımlı olacağımız modeller.
Selçuk Bayraktar’ın Take Off zirvesinde T3 Vakfı olarak bir Türkçe yapay zeka dil modeli üzerinde çalıştıklarının müjdesini verdiğini duyunca çok sevindim. Zira bu teknoloji bağımlılığını engelleyebilmek için çok önemli bir hamle. Zira bu nevi büyük dil modelleri geliştirmek büyük kaynaklar gerektiriyor. Sadece büyük miktarda veri değil, aynı zamanda devasa bir bilgi işlem gücü gerektiriyor. Bu işlemcilerin satın alınması, işlem sırasındaki elektrik tüketimi karşılayabilmek, ancak büyük şirketlerin altından kalkabileceği türden bir yük.
Bu arada yine dikkatleri çekecektir, dil modelleri, özellikle de ticari dil modelleri denilince Amerika dışındaki ülkelerden şimdilik pek ses çıkmıyor. Her ne kadar bu işin lokomotifleri özel şirketler olsa da hepsi Amerikan menşeli şirketler. OpenAI, Microsoft, Google ve xAI’ın (Elon Musk’ın şirketi.)’nden sonra Amazon ve IBM de bu kervana katıldıklarını duyurdular.
Ben artık iyiden iyiye Google’ın bu rekabetin gerisinde kaldığını düşünmeye başlamıştım ki Google “did you mean” dercesine, bütün bildiklerimizi unutturacak bir hamle ve yapay zeka modellerine yepyeni bir yaklaşımla çıkageldi.
Google’ın sessizliğini hayra yormamakta haksız değildik, zira Google uzun zamandır yapay zeka alanına çuvalla para yatırıyordu. Alphabet adını alması ile birlikte bir “data” şirketi olduğunu iddia ve ilan eden şirket bu sahada en avantajlı konumdaki şirket idi. Hatta bugünkü GPT modellerinin motor gücü olan transformersların da (Arabalara dönüşen robotlardan söz etmiyorum.) dünyaya kazandırılmasının esas müsebbibi olarak gelişmeleri sessiz sedasız takip ediyordu.
Sessizliğin nedeni nihayet 7 Aralık’ta belli oldu. Google, Gemini isimli çoklu modelini duyurdu. Çoklu model ne mi demek? Gemini’nin web sayfasında bu “anything to anything” olarak tarif ediliyor. Yani ChatGPT’nin ücretsiz versiyonundan alıştığımız metin formatı dışında, ses, görüntü ve sair multimedya türünde girdiler verip, çıktılar alabiliyorsunuz. Üstelik başarım testlerinde pek çok başlıkta GPT 4’ü yakaladığı, hatta yer yer GPT-4’ü geçtiği görülebiliyor.
Gemini, İkizler takımyıldızının Latince adı. İletişimi temsili ile meşhur Merkür gezegeni tarafından yönetilen, zodyaktaki hava grubundaki ilk burç. Astrologlara sorarsanız Boğa burcunun inatçılığı ve toprak tabiatlı katılığına doğanın verdiği kaotik yanıt olarak tarif ediliyor. Google’ın Gemini ile bu isme yakışır büyük bir gürültüyle sesizliğini bozması, OpenAI’ın 6 Ekim’de gerçekleştirdiği büyük sükseli geliştirici günü etkinliğini gölgede bırakması bugünlerin tarihini yazacak tarihçiler (yapay zeka modelleri mi demeliydim) tarafından mutlaka hatırlanacak.
Google, Gemini’nin üç farklı türde yayınlanacağını belirtiyor. Gemini Ultra, Gemini Pro ve Gemini Nano. Müjdemi isterim, Gemini Pro, Bard’da kullanılmaya başlandı bile. Gemini Ultra 13 Aralık itbariyle Google AI Studio and Google Cloud Vertex AI platformlarında kullanılmaya başlanacak. Gemini Nano ise taşınabilir bir model. Muhtemelen telefonlarda, diğer mobil cihazlarda artık yetenekli bir asistanımız olacak. Meraklılar, Gemini’nin yeteneklerini https://deepmind.google/technologies/gemini/# adresindeki lansman videolarından izleyebilirler, lütfen izlerken ağzınızı kapatmayı unutmayın.
Hasılı, her güne yeni bir dil modeli, yapay zeka alanında yaşanan hafsalalara durgunluk verecek bir gelişme ile başlıyoruz.
Bu yazının kanlı, canlı bir insan tarafından yazıldığını taahhüt ederim.