Openai, açık kaynaklı topluluk için tasarlanmış yeni, açık ağırlıklı dil modellerinden oluşan yeni bir aile olan GPT-OSS'i tanıttı. Bu modeller, bir dizi donanımla verimlilik, hız ve geniş uyumluluk için optimize edilmiştir, bu da onları büyük ölçekli altyapıya güvenmeden özelleştirilebilir AI araçları isteyen geliştiriciler ve araştırmacılar için idealdir.
GPT-OSS üç model boyutunda piyasaya sürülüyor: 120 milyon, 410 milyon ve 1.1 milyar parametre. Her sürüm talimat ayarlıdır ve birden fazla dili destekler. Bu modeller GPT-3.5 ve GPT-4'ten daha küçüktür, ancak kenar cihazlarında hızlı performans sağlamak ve çevrimdışı veya kısıtlı ortamlarda iyi çalışacak şekilde tasarlanmıştır. Küçük boyutlarına rağmen, modeller MMLU ve GSM8K dahil olmak üzere çeşitli kriterlerde güçlü sonuçlar gösterir.
GPT-OSS'nin amacı, özellikle düşük gecikme, yorumlanabilirlik veya enerji verimliliğinin önceliklendirildiği kullanım durumlarında, daha büyük modellere hafif, esnek bir alternatif sunmaktır. Modeller ayrıca akademik araştırma veya ince ayar deneyleri için güçlü temel çizgiler olarak kullanılmaktadır. Openai, karşılaştırılabilir açık ağırlık modellerine karşı GPT-OSS'ye kıyasladıklarını ve bunları genel dil görevlerinde rekabetçi bulduklarını belirtiyor.
ChatGPT veya GPT-4'ün aksine, GPT-OSS modelleri daha geniş Openai ekosistemine bağlı değildir. Yerel API entegrasyonu, bellek veya tarama desteği yoktur. Bunun yerine, açık ağırlıklı bir lisansla yayınlanırlar ve GitHub ve Hugging Yüzünde mevcuttur, geliştiricilere dağıtım, özelleştirme ve yerel kullanım üzerinde tam kontrol sağlar. Ağırlıklar, şeffaflık için model kartları ve değerlendirme metrikleri ile birlikte gelir.
Openai'nin GPT-OSS sürümü, hafif modellerin cihaz içi uygulamalar ve özel dağıtımlar için popülerlik kazandığı bir zamanda gelir. Açık ağırlıklı modellere olan ilginin artmasıyla ve tekrarlanabilir araştırma ihtiyacı olan GPT-OSS, Openai'nin eğitim altyapısının güvenilirliği ile daha küçük ölçekli LLM'ler arayanlar için yeni bir giriş noktası ekliyor. Şirket, bu modellerin özel kullanıcı verileri kullanılarak eğitilmediğini ve güvenlik değerlendirmelerinin model kartlarında belgelendiğini vurguladı.
Ayrıca okuyun:Çin'in açık kaynaklı yapay zeka modeli 'goku' bize hakimiyete meydan okuyor
GPT-OSS, akıl yürütme veya çok sayıda sohbet kalitesinde GPT-4'e rakip olmasa da, erişilebilirliği, performans / boyut oranı ve deney kolaylığı, açık ağırlıklı modellerin ekosistemine değerli bir katkı haline getirir. Geliştiriciler artık GPT-OSS ile yerel olarak inşa edebilir, belirli alanlar için ince ayar yapabilir veya mimarlık araştırmaları için bir test yatağı olarak kullanabilir.
