Apple'ın MGIE ve Keyframer, görüntülere ve animasyonlara AI ile çalışan yaratıcılık getiriyor

Apple kısa süre önce iki AI aracını tanıttı: MGIE (MLLM kılavuzlu görüntü düzenleme) ve Key Framer. Bu son teknolojiler, kullanıcıların görüntüler ve animasyonlarla etkileşim kurma şeklini yeniden tanımlamayı vaat ederek, karmaşık görevleri basitleştirmek ve yaratıcı çabaları herkes için daha erişilebilir hale getirmek için yapay zekanın gücünden yararlanıyor.

Apple's MGIE, doğal dil komutlarıyla fotoğrafları düzenlemenize izin verir, Keyframer, sanatı metin istemleriyle canlandırır

California Üniversitesi, Santa Barbara'dan araştırmacılarla ortaklaşa olan Apple, doğal dil komutları aracılığıyla görüntü düzenlemesinde devrim yapmak için tasarlanmış bir AI modeli olan MGIE'yi tanıttı. MGIE, multimodal büyük dil modellerini (MLLMS) kullanarak, kesintisiz ve sezgisel bir düzenleme deneyimi sunarak hassas piksel seviyesi manipülasyonları gerçekleştirmek için kullanıcı talimatlarını yorumlar. Kırpma ve yeniden boyutlandırma gibi temel ayarlamalardan, nesne manipülasyonu ve renk geliştirme gibi gelişmiş değişikliklere kadar MGIE, kullanıcılara özel yazılıma ihtiyaç duymadan yaratıcılıklarını açığa çıkarmalarını sağlar.

Apple'ın Key Framer, animasyon tasarımında önemli bir ilerlemeyi temsil ederek kullanıcıların basit metin istemlerini kullanarak statik görüntüleri canlandırmasını sağlıyor. Büyük dil modelleri (LLMS) tarafından desteklenen Keyframer, statik SVG görüntülerinden ve metin açıklamalarından CSS animasyon kodu oluşturarak karmaşık animasyon yazılımına olan ihtiyacı ortadan kaldırır. Hala prototip aşamasındayken, Keyframer, Apple'ın ürün ekosistemine gelecekteki entegrasyon için muazzam bir potansiyele sahiptir ve sezgisel ve erişilebilir animasyon yaratma yolunu açar. Bir kağıttanyayınlanmışApple araştırmacıları tarafından:

Keyframer, statik görüntülerden (SVGS) animasyonlar oluşturabilen büyük bir dil modeli (LLM) güçlü bir animasyon prototipleme aracıdır. Kullanıcılar, istemi ekleyerek ve LLM tarafından oluşturulan CSS animasyon kodu veya özelliklerini düzenleyerek tasarımlarını yineleyebilir. Ayrıca, kullanıcılar fikirlerini ve keşiflerini desteklemek için tasarım varyantları isteyebilirler.

Tek atışlı yönlendirme arayüzleri, Dall · E ve Midjourney gibi ticari metin-görüntü sistemlerinde yaygın olmakla birlikte, animasyonların, zamanlama ve koordinasyon gibi, kullanıcıları yinelemeli olarak oluşturulabilmesi ve rafine etmesi için özel olarak ihtiyaç duyulan alternatif yaklaşımlar, zamanlama ve koordinasyon gibi daha karmaşık bir kullanıcı hususunu gerektirdiğini savunuyoruz.

İLGİLİ:Apple'ın 'Project Mulberry', AI ile çalışan sağlık izini iOS 19 ve Watchos'a getirebilir

Keyframer adı verilen yeni bir AI destekli animasyon aracı oluşturmak için LLM'lerin kod nesil yetenekleriyle tasarım artefaktlarının dil tabanlı yönlendirme için ortaya çıkan tasarım ilkelerini birleştirdik. Keyframer ile kullanıcılar, doğal dil isteme yoluyla statik 2D görüntülerden animasyonlu çizimler oluşturabilirler. GPT-4 3 kullanarak Key Framer, bir giriş ölçeklenebilir vektör grafiğini (SVG) canlandırmak için CSS animasyon kodu oluşturur.

Hem MGIE hem de Keyframer, yaratıcılığı güçlendirme ve tasarımı demokratikleştirme talebini örneklendirir. Yapay zeka ve doğal dil işlemeden yararlanarak, bu araçlar girişin önündeki engelleri bozar, gelişmiş düzenleme ve animasyon özelliklerini tüm beceri seviyelerindeki kullanıcılar için erişilebilir hale getirir.

Devamını oku:

  • Apple, WWDC 2024 - Gurman - Classic E'de Siri için üretken AI özelliklerini ortaya çıkaracak