أداة ذكاء اصطناعي تولد فيديو من صورة واحدة

ميدار نت- لندن
ذكاء اصطناعي
فيديو
23 نوفمبر 2023
Cover

ميدار نت- لندن

من خلال صورة واحدة بات بإمكان المستخدمين إنساء فيديو، وذلك بالاعتماد على أداة للذكاء الاصطناعي أطلقتها شركة Stability AI وحملت اسم  Stable Video Diffusion.

وأصدرت الشركة الأداة الجديدة على شكل نموذجين، كل منهما قادر على توليد بين 14 إطارًا و 25 إطارًا بسرعات تتراوح بين 3 إطارات في الثانية و 30 إطارًا في الثانية وبدقة قدرها 576×1024 بكسل.

 

آلية العمل

وتعتمد الأداة على نموذج توليد الصورة بالذكاء الاصطناعي Stable Diffusion، ويمكن للراغبين في تشغيل النموذج الجديد الموافقة على شروط استخدام معينة، تحدد التطبيقات المقصودة من Stable Video Diffusion، مثل الأدوات التعليمية أو الإبداعية، والتطبيقات غير المقصودة، مثل التمثيلات الواقعية أو الحقيقية للأشخاص أو الأحداث.

وذكرت Stability AI أنه بإمكان المستخدمين المحتملين التسجيل ضمن قائمة الانتظار من أجل الوصول إلى تجربة الويب القادمة المتميزة بواجهة تحويل النص إلى الفيديو.

وتعرض الأداة التطبيقات المحتملة في قطاعات تشمل الإعلان والتعليم والترفيه والمزيد. ويتاح منتج Stable Video Diffusion في هذه المرحلة لأغراض البحث فقط، وليس للتطبيقات الواقعية أو التجارية.

ويستطيع منتج Stable Video Diffusion تجميع طرق العرض المتعددة من إطار واحد مع الضبط الدقيق لمجموعات البيانات ذات طرق العرض المتعددة.

وقالت الشركة: “وجدنا من خلال التقييم الخارجي أن هذه النماذج تتفوق على النماذج المغلقة الرائدة في دراسات تفضيلات المستخدم”، وذلك عند مقارنتها بمنصات تحويل النص إلى فيديو Runway و Pika Labs.

 

العيوب

ورغم أن الأداة مقاطع فيديو ذات جودة عالية نسبيًا، وتتوافق مع الأنظمة التوليدية المنافسة، لكنها تواجه بعض القيود، إذ يولد المنتج فيديو قصير نسبيًا مدته 4 ثوانٍ يفتقر إلى الواقعية المثالية.

كما أن الفيديو غير قادر على تحريك الكاميرا، ولا يوجد تحكم في النص، أو إنشاء نص مقروء، وقد لا يولد الوجوه والأشخاص بشكل صحيح.

ودربت Stability AI الأداة على مجموعة بيانات تضم الملايين من مقاطع الفيديو، مع ضبطتها لاحقًا عبر مجموعة صغيرة تتكون من مئات الآلاف من مقاطع الفيديو.

وذكرت الشركة أنها تستخدم مقاطع الفيديو المتاحة للعامة من أجل أغراض البحث.

&nb