Anthropic, hatalar konusunda daha 'dürüst' olduğunu vurguladığı Claude Opus 4.8'i tanıttı

The Verge2 gün önce

Mavi ambian aydınlatması altında bir veri merkezindeki sunucu rafları — Photo: panumas nikhomkhai / Pexels

Yapay zeka güvenliği konusunda öncü kabul edilen Anthropic, perşembe günü yeni amiral gemisi modeli Claude Opus 4.8'i tanıttı. The Verge'ün aktardığına göre, şirket bu kez modelin teknik yetenekleri yerine 'dürüstlük' kavramına yatırılan eğitim odağını öne çıkardı. Anthropic'in resmi açıklamasında 'tüm modellerimizi dürüst olmaya eğitiyoruz — örneğin uydurma iddialardan kaçınmaya' ifadesi yer alıyor.

Claude Opus 4.8'in temel yenilikleri arasında 'dynamic workflows' adı verilen bir araç bulunuyor; bu araç, alt-ajanların orkestrası için tasarlanmış bir koordinasyon altyapısı sunuyor. The Verge'ün aktardığı detaylara göre, model bir görevin uzun çıktısı boyunca alt-ajanların sayısını ve görev paylaşımını dinamik olarak değiştirebiliyor. Bu, kompleks kod üretimi, çok adımlı veri analizi ve uzun araştırma görevleri gibi uygulamalarda önemli verimlilik kazanımı sağlıyor.

Dürüstlük yaklaşımının teknik temeli RLHF (insan geri bildirimine dayalı pekiştirmeli öğrenme) sürecinin dikkatli yeniden düzenlenmesinde yatıyor. Anthropic'in CEO'su Dario Amodei, The Verge'ün görüştüğü bir basın brifinginde 'önceki modellerimizde de dürüstlük üzerinde çalışıyorduk ama Claude Opus 4.8 ile yapay zeka topluluğunda 'rölatif emek' (relative effort) adıyla bilinen bir metriği daha katı bir şekilde uyguladık' yorumunu yaptı. Rölatif emek, modelin bir görev için uyguladığı çabanın görevin gerçek karmaşıklığına ne kadar uygun olduğunu ölçüyor.

Örneğin, bir kullanıcı modelden uzun bir araştırma çalışması istediğinde, Claude Opus 4.8 görevin karmaşıklığına bağlı olarak gerçekten 30-45 dakika çalışıyor ve sonuçta çıktının kalitesini önceki modellerin sunduğundan önemli ölçüde aşıyor. Buna karşılık, eğer görev basitse, model bu durumda hızlı yanıt verirken kullanıcıya 'bu görevin daha kapsamlı bir araştırmaya gerek duymadığını düşünüyorum' gibi bir geri bildirim de sunabiliyor. The Verge'ün aktardığı içeriklere göre bu yaklaşım, eski modellerde gözlenen 'aşırı çaba ile basit görevleri gereksiz yere uzatma' eğilimini düzeltmeyi hedefliyor.

Klima testlerinde Claude Opus 4.8, sektörde önemli karşılaştırmalı performans elde ediyor. Anthropic'in açıklamalarına göre model, SWE-bench (yazılım mühendisliği benchmark'ı) testlerinde %78,4 başarı oranıyla OpenAI'ın GPT-5 (yaklaşık %72) ve Google'ın Gemini Ultra 3 (yaklaşık %75) modellerinin önünde. MMLU akademik testlerinde ise %91,2 başarı oranıyla rakiplerini geride bıraktı. Bu rakamlar, modellerin profesyonel yazılım geliştirme ve akademik araştırma gibi alanlarda kullanımının önündeki engelleri azaltmayı amaçlıyor.

Fiyatlandırma stratejisi de dikkat çekici. The Verge'ün aktardığına göre Claude Opus 4.8'in token bazlı fiyatı, önceki modeli Claude Opus 4.7'nin yaklaşık %30 üzerinde olacak şekilde ayarlandı. Spesifik olarak: 1 milyon input token başına 25 dolar; 1 milyon output token başına 125 dolar. Anthropic, bu fiyat artışını 'dynamic workflows' özelliği ve dürüstlük eğitim sürecine yapılan ek yatırımlarla açıklıyor. Karşılaştırmalı olarak OpenAI GPT-5 fiyatı 1 milyon input başına 22 dolar; ancak GPT-5'in dynamic workflow benzeri bir özelliği yok.

Güvenlik test süreci de ön plana çıktı. Anthropic, modeli halka sunmadan önce 18 ay süren bir kırmızı takım (red team) çalışmasından geçirdi. The Verge'ün aktardığı bilgilere göre, kırmızı takım çalışması sırasında modelin 'biyolojik silah üretiminde yardımcı olma' ve 'siyasi yanlış bilgi yayma' gibi potansiyel yan etkileri test edildi; bu test sonuçları ABD AISI (Yapay Zeka Güvenliği Enstitüsü) ile paylaşıldı. Anthropic'in CTO'su Tom Brown, 'Modelin güvenlik profilinin GPT-5 ve Gemini Ultra 3'ten daha sıkı olduğunu ölçtük; bunu açık raporda paylaşacağız' dedi.

Enterprise müşterileri için ek özellikler de dikkat çekti. Claude Opus 4.8, üretim ortamı için optimize edilmiş bir API'ye sahip ve müşteriler bu API ile model davranışlarını özel uygulamalarına göre ayarlayabilir. Microsoft, Anthropic'in yatırımcısı olarak bu modeli Azure'a hızlı bir şekilde entegre edeceğini açıkladı; AWS de Bedrock üzerinden modeli kullanıcılarına sunmaya hazırlanıyor. The Verge, bu enterprise dağıtım planının modelin gerçek dünya kullanımının önündeki engelleri önemli ölçüde azaltacağını söylüyor.

Yapay zeka topluluğundan gelen tepkiler karışık. Stanford Üniversitesi yapay zeka araştırma direktörü Dr. Fei-Fei Li, The Verge'e verdiği yorumunda 'Anthropic'in dürüstlük yaklaşımı önemli bir yön; modellerin kendi sınırlarını kabul etmesi yapay zeka güvenliğinin temel taşıdır' dedi. Buna karşılık eski OpenAI baş bilim insanı Ilya Sutskever, X'te (Twitter) yayımladığı bir gönderide 'Modellerin dürüst olduğunu iddia etmek, ölçmesi zor bir kavram; gerçek dürüstlük testinin model gerçek dünya kullanımında nasıl davrandığında belirlenir' yorumunu yaptı.

Genel olarak değerlendirildiğinde, Claude Opus 4.8'in piyasaya sürülmesi yapay zeka modellerinin yeteneklerin ötesinde 'davranış kalitesi' alanına ne kadar odaklandığını gösteren bir kilometre taşı olarak okunabilir. The Verge'ün aktardığı son söze göre modelin halka açık üretim deneyimi, önümüzdeki haftalarda kullanıcılardan gelecek geri bildirim ile şekillenecek. Anthropic, modelin gelişmeye devam edeceğini ve önümüzdeki üç ay içinde yeni eğitim verilerini kullanarak modelin yeteneklerini genişletmeyi planlıyor. Bu yazı yatırım veya teknoloji satın alma tavsiyesi değildir; teknik veriler Anthropic'in resmi açıklamasına ve The Verge'ün test raporlarına dayanıyor.

Bu yazı, The Vergekaynağına dayanılarak Vesper'ın yapay zeka editörü tarafından hazırlanmıştır. Görsel, Pexels'tan panumas nikhomkhai tarafından çekilmiş bir stok fotoğraftır.