ما هو فيديو الاتحاد الاقتصادي والنقدي؟
هذه الأداة، كما يوحي اسمها، مخصصة لإنشاء الفيديو. يصفها ميتا بأنها "طريقة بسيطة لتوليد النص إلى الفيديو بناءً على نماذج الانتشار". يجب أن يستجيب Emu Video لمجموعة متنوعة من المدخلات: النص فقط، والصورة فقط، وكل من النص والصورة. تنقسم العملية إلى خطوتين، يوضح ميتا: أولاً، إنشاء صور مشروطة بمطالبة نصية، ثم إنشاء فيديو مشروط بكل من النص والصورة التي تم إنشاؤها.
إن أسلوبنا المتطور سهل التنفيذ ويستخدم نموذجين فقط للنشر لإنشاء مقاطع فيديو بدقة 512 × 512 مدتها أربع ثوانٍ بمعدل 16 إطارًا في الثانية.
ما هو تحرير الاتحاد الاقتصادي والنقدي؟
يجب أن يسمح هذا "بالتحرير الدقيق للصور" من خلال مهام التعرف والتوليد. كما يقول ميتا، غالبًا ما يكون استخدام الذكاء الاصطناعي التوليدي بمثابة عملية، وليس مهمة واحدة.
"Emu Edit قادر على التحرير الحر من خلال التعليمات، ويشمل مهام مثل التحرير المحلي والعالمي، وإزالة الخلفية وإضافتها، وتحويلات الألوان والهندسة، والكشف والتجزئة، والمزيد. غالبًا ما تميل الأساليب الحالية نحو الإفراط في التعديل أو الأداء الضعيف في مهام التحرير المختلفة. نحن نرى أن الهدف الأساسي لا ينبغي أن يقتصر فقط على إنتاج صورة "معقولة". بدلاً من ذلك، يجب أن يركز النموذج على التغيير الدقيق لوحدات البكسل ذات الصلة بطلب التحرير فقط. على عكس العديد من نماذج الذكاء الاصطناعي التوليدية اليوم، يتبع Emu Edit التعليمات بدقة، مما يضمن بقاء وحدات البكسل الموجودة في الصورة المدخلة غير المرتبطة بالتعليمات دون تغيير. على سبيل المثال، عند إضافة النص "Aloha!" يقول فريق Meta: "بالنسبة لقبعة البيسبول، يجب أن تظل القبعة نفسها دون تغيير".
حالات الاستخدام المحتملة
الطريق إلى الأمام هو بالتأكيد مدفوع بالذكاء الاصطناعي لـ Meta.
"على الرغم من أن هذا العمل يعد بحثًا أساسيًا بحتًا في الوقت الحالي، إلا أن حالات الاستخدام المحتملة واضحة بوضوح. تخيل إنشاء ملصقاتك المتحركة الخاصة أو صور GIF الذكية بسرعة لإرسالها في الدردشة الجماعية بدلاً من الاضطرار إلى البحث عن الوسائط المثالية لردك. أو تحرير الصور والصور الخاصة بك، دون الحاجة إلى مهارات تقنية. أو أضف بعض الجاذبية الإضافية إلى منشوراتك على Instagram عن طريق تحريك الصور الثابتة. أو إنشاء شيء جديد تمامًا"، يختتم منشور المدونة.