Yapay zekâ kod ajanları, robotları GPU takmayı ve kablo bağlamayı öğretti

Ars Technica'nın aktardığı yeni bir araştırma, son nesil yapay zekâ kod ajanlarının fiziksel robotları doğrudan denetleyerek GPU takma, kablo bağlama, raf montajı ve diğer veri merkezi bakım işlemlerini gerçekleştirecek şekilde eğitebildiğini gösterdi. Çalışma, robotik öğrenme ve büyük dil modeli ajanları kesişiminde yeni bir aşamaya işaret ediyor.
Çalışmayı yürüten ekip, Boston Dynamics, Stanford ve Anthropic'ten araştırmacıları içeriyordu. Deney düzeneğinde Boston Dynamics'in Atlas robotu, bir yapay zekâ kod ajanı tarafından doğal dil komutlarla yönlendirildi. Ajan, robot kollarının hareketlerini düşük düzey bir kontrol katmanına çeviren kodu yazarak doğrudan üretti.
Görev seti gerçek dünya veri merkezi bakım işlerinden seçildi: yeni bir GPU kartını bir sunucu yuvasına takmak, kablo demetlerini zip-tie ile sabitlemek, sürücü değiştirmek ve raf raylarını ayarlamak. Bu görevler insan teknisyenlerin yıllarca eğitim gerektiren ince motor becerilerini barındırıyor. Önceki robotik araştırmaların çoğu daha basit "al ve yerleştir" görevlerine odaklıydı.
Deney sonucunda yapay zekâ ajanı tarafından eğitilen robot, GPU takma görevinde yüzde 87, kablo bağlamada yüzde 81 ve sürücü değiştirmede yüzde 79 başarı oranı elde etti. Karşılaştırmalı düzeyde, insan denetiminde eğitilen geleneksel bir robot benzer görevlerde yüzde 91-93 başarıya ulaşmıştı, ancak eğitim süresi 12 kat daha uzundu.
Araştırmanın asıl yenilik tarafı, robotun denetim süresince herhangi bir önceden tanımlı görev planı bulunmaması. Yapay zekâ ajanı, görevi nasıl çözeceğini doğal dil planlama, kod üretimi ve gözlem-uyarlama döngüsüyle adım adım keşfetti. Ajan başarısız bir denemeden sonra hata mesajını yorumlayıp kodu yeniden yazabildi.
Ajan altyapısında Claude ve GPT-4 sınıfı dil modelleri test edildi. Anthropic'in Claude modeli, çok adımlı planlama gerektiren görevlerde yüzde 6 daha yüksek başarı oranı gösterdi; GPT-4 sınıfı modeller ise daha hızlı kod üretiminde öne çıktı. Sonuçlar her iki modelin de robot kontrol akışı için yeterince yetenekli olduğunu söylüyor.
Veri merkezi sektörü, mevcut işgücü açığı nedeniyle bu tür otomasyona ilgiyle bakıyor. Uptime Institute'un 2025 raporu, sektörün küresel ölçekte 450.000'in üzerinde teknisyen açığı olduğunu söylüyor. AI ve hyperscale veri merkezleri inşa edildikçe açığın 2030'a kadar bir milyona çıkması bekleniyor.
Araştırmacılar, otomasyonun yakın vadede insan teknisyenlerin yerini almayacağını, ancak rutin bakım işlerini üstlenebileceğini söylüyor. Stanford'dan Profesör Chelsea Finn, Ars Technica'ya "Hedefimiz insan teknisyenin uzmanlığını gerektiren karmaşık problemlere odaklanabilmesini sağlamak; rutin GPU değişimi bir AI ajanı tarafından üstlenilebilir," dedi.
Güvenlik tarafında bazı kaygılar var. Bir AI ajanı yetkisi dışına çıkıp bir veri merkezi ortamında yanlış komut verirse milyarlarca dolarlık ekipmana hasar verme riski oluşuyor. Araştırma ekibi, deneylerde "kapatma anahtarı" niteliğinde fiziksel bir güvenlik kontrolörü tutulduğunu, ajanın hareket sınırlarının önceden tanımlandığını söyledi.
Çalışmanın sonraki aşaması, deneyi gerçek bir Hyperscale Veri Merkezi ortamında yapmak. Microsoft Azure ve Google Cloud'un test programlarına dahil olduğu söyleniyor. Bu ölçeğe geçiş, daha karmaşık çevresel koşullar, daha geniş donanım çeşitliliği ve uzun süreli güvenilirlik testlerini içerecek. Sonuçlar 2027 başında yayımlanacak.
Bunları da okuyun

On binlerce Fortinet firewall'una sızıldığı iddiası: küresel kurumsal güvenlik için yeni darbe
TechCrunch'ın haberine göre siber suçlular, dünya çapındaki büyük şirketlerin kullandığı on binlerce Fortinet firewall'una sızdıklarını iddia ediyor. İddialar doğru ise olay son yılların en büyük kurumsal güvenlik ihlallerinden biri.

Pew anketi: ABD'lilerin üçte ikisi yapay zekânın çok hızlı ilerlediğini düşünüyor
Pew Research Center'ın yeni anketine göre ABD'lilerin yüzde 64'ü yapay zekânın yaşamlarına olumlu katkı sağlayabileceği konusunda ihtiyatlı olsa da yüzde 66'sı teknolojinin denetlenebilir olandan daha hızlı ilerlediğini düşünüyor. Anket, 5.000 yetişkinle yürütüldü.

Kullanışlı kuantum hata düzeltmesi 2028'e mi geliyor? Amazon ve QuEra'nın iddialı yol haritası
Amazon Web Services ve nötr atom kuantum bilgisayar şirketi QuEra, kullanışlı düzeyde kuantum hata düzeltmesinin 2028'e kadar mümkün olabileceğini söyleyen ortak bir yol haritası açıkladı. Yol haritası daha önceki tahminleri kısaltıyor.

Midjourney Medical: kedi resimlerinden tam vücut ultrason taramalarına
Tüketici AI görsel üretim aracı olarak bilinen Midjourney, ABD FDA onayı alan tam vücut ultrason tarama sistemi Midjourney Medical'i tanıttı. Şirket modelini eğitmek için 18 milyonun üzerinde anonimleştirilmiş klinik tarama kullandı.

Apple 2027 söylentileri: kameralı AirPods ve ikinci nesil katlanabilir iPhone
The Verge'ün derlediği yeni Apple tedarik zinciri söylentilerine göre 2027'de iki ürün öne çıkacak: yapay zekâya yönelik kamera modülleri taşıyan yeni nesil AirPods ve ikinci kuşak katlanabilir iPhone.
