Son Dakika
Teknoloji

Yapay zekâ sözlüğü 2026: token'lardan halüsinasyonlara temel terimler açıklandı

TechCrunch1 sa önce
Yapay zekâ sistemlerini temsil eden, bağlı düğümlerden oluşan soyut bir ağ
Yapay zekâ sistemlerini temsil eden, bağlı düğümlerden oluşan soyut bir ağPhoto: Google DeepMind / Pexels

Yapay zekâ, neredeyse teknolojinin kendisi kadar hızlı ilerleyen bir sözcük dağarcığı geliştirdi ve bu terimler artık iş manşetlerinde, ürün lansmanlarında ve politika tartışmalarında rutin olarak beliriyor. Birkaç temel kavramı anlamak, bu haber selini izlemeyi çok daha kolaylaştırıyor. Bu sözlük, teknik bir altyapı varsaymadan en önemlilerini yalın bir dille ele alıyor.

Mevcut dalganın merkezinde büyük dil modeli, yani LLM var. Bu, öncesinde gelenlere bakarak en olası bir sonraki yazı parçasını tahmin etmek için çok büyük miktarda metinle eğitilmiş bir yapay zekâ sistemi türü. Kulağa basit gelen bu mekanizma, muazzam ölçüde büyütüldüğünde, sohbet botları gibi sistemlerin akıcı yanıtlar, özetler ve kod üretmesini sağlıyor. İnsanlar üretken yapay zekâdan söz ettiğinde genellikle, görüntü, ses veya video üreten modellerin yanı sıra LLM'leri kastediyor.

Metni işlemek için modeller onu, kabaca sözcüklere veya sözcük parçalarına karşılık gelen metin öbekleri olan token'lara ayırıyor. Bir model harfleri veya cümleleri insanların yaptığı gibi okumuyor; token'larla çalışıyor ve aynı anda dikkate alabildiği token sayısına bağlam penceresi deniyor. Daha büyük bir bağlam penceresi, bir modelin yanıt vermeden önce uzun bir belge gibi daha fazla bilgiyi almasını sağlıyor.

Eğitim, bir modeli veriyle karşılaştırıp parametre denen iç ayarlarını iyi performans gösterene kadar düzelterek oluşturma süreci. Parametreler, modelin eğitim sırasında ayarladığı sayısal değerler ve sayıları (çoğu zaman milyarlarca) bir modelin boyutu ve kapasitesi için kabaca bir gösterge. İlk eğitimden sonra modeller sıklıkla ince ayarla (davranışlarını belirli bir görev için biçimlendirmek üzere daha özgül veriyle ek eğitimle) rafine ediliyor.

Günlük kullanıma giren bir terim halüsinasyon. Bu, bir yapay zekâ sisteminin makul gelen ama yanlış veya uydurma bilgi ürettiği durumu tanımlıyor. Halüsinasyonlar temel bir zorluk; çünkü model doğrulanmış olguları getirmek yerine olası gelen metin üretiyor, dolayısıyla yanlış şeyleri doğru olanlarla aynı kendinden emin tonla söyleyebiliyor. Halüsinasyonları azaltmak, mevcut araştırmanın başlıca odağı.

Modelleri daha güvenilir kılmak için sıklıkla kullanılan bir teknik geri-getirmeyle güçlendirilmiş üretim, yani RAG. Yalnızca modelin eğitim sırasında öğrendiğine dayanmak yerine RAG, sistemin bir belge veritabanı gibi harici bir kaynaktan ilgili bilgiyi aramasına ve yanıtını buna dayandırmasına olanak tanıyor. Bu, modelin yalnızca eğitim verisine değil güncel malzemeye başvurabilmesi sayesinde yanıtları doğru ve güncel tutmaya yardımcı oluyor.

Çıkarım (inference), eğitilmiş bir modeli, onu ilk baştan eğitmenin aksine, bir çıktı almak için fiilen çalıştırmanın terimi. Bir sohbet botuna her soru sorduğunuzda bu çıkarımdır. Ticari olarak önemli; çünkü çıkarım, model her kullanıldığında işlem gücü tüketiyor ve büyük ölçekte bu maliyetler birikiyor; bu yüzden verimli çıkarım, yapay zekâ şirketleri için rekabetçi ve finansal bir öncelik hâline geldi.

En hızlı yükselen terimlerden biri yapay zekâ ajanı. Ajan, tek bir istemi yanıtlamakla kalmayıp bir hedefi gerçekleştirmek için araç kullanmak, bilgi taramak ya da adımları sırayla yürütmek gibi bir dizi eylemi gerçekleştirebilen bir sistem. Ajanlar, yapay zekânın bir soru-yanıt aracı olmaktan çok adımlı görevleri yürütebilen yapay zekâya doğru bir kaymayı temsil ediyor; uygulamada ne kadar yetkin ve güvenilir oldukları ise hâlâ canlı bir tartışma.

Birkaç başka terim de sık tekrarlanıyor. Çok kipli (multimodal), metin ve görüntü gibi birden fazla giriş veya çıkış türünü işleyen modelleri tanımlıyor. Açık ağırlıklı veya açık kaynaklı modeller, temel parametreleri kamuya açık biçimde yayımlanan, başkalarının çalıştırıp uyarlamasına olanak tanıyan modeller; yalnızca bir şirketin hizmeti üzerinden erişilen kapalı modellerin aksine. İstem mühendisliği ise daha iyi sonuçlar almak için bir modele verilen girdiyi tasarlamayı ifade ediyor.

Bu terimleri bilmek altlarındaki matematiği anlamayı gerektirmiyor ve sözcük dağarcığı alan geliştikçe gelişmeye devam edecek. Ancak LLM'ler, token'lar, eğitim, halüsinasyonlar, çıkarım ve ajanlara dair işlevsel bir kavrayış, günlük haberlerde geçenlerin çoğunu kapsıyor; aksi hâlde anlaşılmaz kalan duyuruları, sıradan bir okurun izleyip değerlendirebileceği bir şeye dönüştürüyor.

Bu yazı, TechCrunchkaynağına dayanılarak Vesper'ın yapay zeka editörü tarafından hazırlanmıştır. Görsel, Pexels'tan Google DeepMind tarafından çekilmiş bir stok fotoğraftır.

Bunları da okuyun