California Üniversitesi Berkeley'deki bir araştırmacı ekibi, Deepseek AI'nın arkasındaki çekirdek teknolojiyi şaşırtıcı derecede düşük bir maliyetle sadece 30 dolarlık başarıyla yeniden yarattı. Ph.D. Aday Jiayi Pan, ekip Deepseek R1-Zero'nun takviye öğrenme yeteneklerini sadece 3 milyar parametreli küçük bir dil modeli kullanarak çoğaltmayı başardı.
Mütevazı büyüklüğüne rağmen, AI kendi kendini doğrulama ve arama yeteneklerini gösterdi ve yanıtlarını tekrarlayarak hassaslaştırmasına izin verdi. Problem çözme becerilerini test etmek için araştırmacılar, oyuncuların aritmetik işlemleri kullanarak bir hedef numaraya ulaşmasını gerektiren matematiksel bir bulmaca olan geri sayım oyununu kullandılar. Başlangıçta, AI rastgele tahminler yaptı, ancak takviye öğrenimi ile cevaplarını gözden geçirme ve optimize etme yeteneğini geliştirdi.
Önerilen Okuma:Araştırmacılar Super Mario Bros.
Pan'ın ekibi, 500 milyon parametreli bir modelin yanıtları iyileştirmek için mücadele ederken, 1,5 milyar parametreli bir modelin revizyon tekniklerini içermeye başladığını belirterek farklı model boyutlarını denedi. 3 ila 7 milyar parametreye kadar ölçeklendirildikten sonra, AI problemlerin verimli bir şekilde çözülmesinde önemli bir iyileşme gösterdi.
Bu rekreasyonun karşılanabilirliği, AI gelişiminin maliyetleri hakkında sorular ortaya koymaktadır. Şu anda, Openai, API'si aracılığıyla milyon jeton başına 15 $ ücret alırken, Deepseek milyon jeton başına 0,55 $ çok daha düşük bir oran sunuyor. Bununla birlikte, AI araştırmacısı Nathan Lambert, Deepseek'in iddia edilen karşılanabilirliği hakkında şüphecilik ifade etti ve operasyonel maliyetlerinin yılda 500 milyon dolara 1 milyar dolara ulaşabileceğini savundu.
Buna ek olarak, veri gizliliği ve ulusal güvenlik konusundaki endişeler, Deepseek'in ABD'nin bazı bölümlerinde yasaklanmasına yol açmıştır Bazı raporlar, Deepseek'in Openai'nin chatgpt kullanılarak eğitilmiş olabileceğini ve potansiyel olarak düşük masraflarını açıklamış olabileceğini gösteriyor. Sorular devam ederken, Berkeley'in bulguları, yüksek performanslı AI modellerinin yakın gelecekte çok daha erişilebilir hale gelebileceğini-Openai, Google ve Microsoft gibi AI devlerinin baskınlığını potansiyel olarak bozduğunu gösteriyor.
