يبدو مقطع مصور انتشر عبر الإنترنت لثلاثة وحوش كاسرة ذات أنياب تمشي على جليد أبيض ناصع في نهار مشرق، وكأنه مشهد من إنتاج قناة "ناشيونال جيوغرافيك" الوثائقية، لكن ما ينقض ذلك هو أن حيوان الماموث الصوفي انقرض قبل اختراع الكاميرا بآلاف السنين.
عرضت شركة "أوبن إيه أي" المقطع المصور ومدته 10 ثوان في فبراير لتكشف عبره عن برنامجها الجديد للذكاء الاصطناعي وهو "سورا"، الذي يمكنه تحويل الأوامر المكتوبة إلى مقاطع مصورة واقعية مذهلة تصل مدتها إلى دقيقة كاملة. تذكّر هذه الخاصية والضجة التي أثارتها، بما حدث عام 2022 حين طرحت "أوبن إيه أي" برنامج "تشات جي بي تي"، محدثةً ثورةً في عالم التقنية بين ليلة وضحاها ليصبح الذكاء الاصطناعي على كل لسان.
لكن هذه المرة، لم تكن "أوبن إيه أي" تقدم ابتكاراً جديداً بقدر ما كانت تسعى للحاق بركب شركات ناشئة أخرى تقدم أدوات مشابهة. لم يصاحب عرضها هذا طرح منتج جديد أو حتى مؤشر واضح لتوقيت طرحه المحتمل. وقالت الشركة في تصريح لـ"بلومبرغ نيوز" إنها لم تحدد بعد جدولاً زمنياً لطرح "سورا"، على الرغم من تصريح صدر حديثاً عن أحد مسؤوليها التنفيذيين بأن الخدمة ستُطلق في وقت لاحق هذا العام.
اقرأ أيضاً: لا تصدق ما تراه في عصر إعلانات الذكاء الاصطناعي
تطوّر سريع
استعرضت كلّ من "ميتا بلاتفورمز" و"غوغل" قبل عام ونصف العام مشاريع بحثية لتحويل النصوص إلى مقاطع مصورة بسيطة لا تتجاوز مدتها بضع ثوان، صورها منخفضة الدقة يظهر فيها مخروط بوظة يسيل ذائباً، أو كلب يطير فيما يرتدي زيّ بطل خارق وغير ذلك. وكانت شركة "رنواي إيه أي" (Runway AI) التي جمعت 237 مليون دولار حتى اليوم، قد مهّدت لموجة الحماسة هذه تجاه برامج توليد مقاطع الفيديو بواسطة الذكاء الاصطناعي في مارس مع طرح برنامج "جين–2" (Gen-2).
كانت الخدمة في البداية لا تستطيع إلا إنتاج مشاهد تبدو متقطعة بعض الشيء ومدتها ثلاث ثوان بعد تلقي أوامر مثل "مشاهد من مسيّرة تصوّر الصحراء". وبات البرنامج قادراً اليوم على إنتاج مقاطع فيديو ذات جودة أعلى بكثير تصل مدتها إلى 20 ثانية تقريباً، بحسب ما أفاد به رئيسها التنفيذي كريستوبال فالينزيلا.
تعمل أيضاً شركات ذكاء اصطناعي أخرى ناشئة، بينها "هايبير" (Haiper) و"بيكا" (Pika) و"ستابيليتي إيه أي" (Stability AI) على صنع أدوات قادرة على إنتاج مقاطع مصورة قصيرة أعقد، تتضمن صوراً متحركة ومؤثرات صوتية (مثل الصوت الذي يصدر عندما تصل حرارة مقلاة إلى قطعة لحم).
وقد طرحت الشركات الناشئة برامج لتوليد مقاطع مصورة يمكن لأي كان استخدامها، وهي متوفرة بأسعار زهيدة إن لم تكن مجانيةً. وقد تطورت هذه الأدوات بوتيرة أسرع ممّا كان يتوقعه حتى العاملون على التقنية، لدرجة أثارت قلق المتخوفين من الأثر الاقتصادي لإنتاج مقاطع مصورة بهذه الطريقة، وكذلك من يخشون انتشار المعلومات المضللة التي يصعب كشفها.
اقرأ أيضاً: "OpenAI" تطرح أداة ذكاء اصطناعي تحوّل النص إلى فيديو
مساعدة الإنتاج
قالت ديمي غوو، المؤسسة الشريكة والرئيسة التنفيذية لشركة "بيكا" (Pika)، التي جمعت 55 مليون دولار وطرحت برنامج ذكاء اصطناعي لصنع مقاطع مصورة في نهاية العام الماضي، إن نموذج "سورا" يظهر المستقبل الواعد للتقنية، حتى لو لم تبلغ مرحلة طرح المنتج بعد. أضافت: "إنه يعرض الحدّ الأعلى الذي بلغناه في الاقتراب من المقاطع المصورة عالية الجودة، ومدى اقترابنا من تسويقها الواسع"، وأشارت إلى أن الضجة التي أثارها "سورا" بدأت تساعد شركتها في استقطاب مزيد من الموظفين المحتملين.
قال فالينزيولا إن برنامج "جين–2" يستخدمه ملايين الناس، وبينهم محترفون في استوديوهات الإنتاج والرسوم المتحركة ممن يعتمدون على البرنامج لإعداد المشاهد الأولية ولوحات القصص.
وأوضح أن محرري الأفلام يبتكرون مقاطع مصورة باستخدام "رنواي" ويدمجونها مع مشاهد أخرى لينتجوا لقطات فرعية وتأثيرات بصرية، كما أن المغنية مادونا استخدمت البرنامج لإنتاج بعض المؤثرات البصرية التي بُثّت على المسرح خلال حفلاتها. أضاف أنه مع طرح "سورا"، فإن برامج توليد الفيديو قد "عبرت الجسر" نحو الاستخدام واسع النطاق برغم أنها ما تزال تقنية نامية.
بيّن المخرج بول تريلو الذي تتضمن أعماله إعلانات لـ"فورد أف – 150" وأغان مصورة وأفلام تجريبية، أنه يدمج صور الذكاء الاصطناعي وبرامج توليد المشاهد المصورة في ابتكاراته منذ فترة. ويعدّ تريلو من أوائل مستخدمي "رنواي" حيث قال إن البرنامج يساعده على استكشاف مزيد من المفاهيم والتأثيرات البصرية.
لكنه استبعد أن يتمكن الذكاء الاصطناعي من الحلول مكان المخرجين لأنه لا يقدر على محاكاة العفوية والتباينات الدقيقة التي يجلبها الإبداع البشري. وأضاف: "ثمة أمر يقدمه الذكاء الاصطناعي هو مذهل في بعض الجوانب أكثر من مجرد حمل الكاميرا، فالأمر أشبه بالغوص في محيط غامض لاستكشاف الكنوز الغريبة في قاعه".
اقرأ أيضاً: "يوتيوب" تضيف أدوات الذكاء الاصطناعي لمنتجي الفيديو
قدرات محدودة حتى الآن
قالت جيادا بيستيلي، مسؤولة الأخلاقيات في شركة الذكاء الاصطناعي الناشئة "هاغينغ فايس" (Hugging Face)، إن هذه التقنية قادرة على تسهيل إضافة مؤثرات بصرية إلى الأفلام وتقليل كلفتها، ما قد يساعد على وجه الخصوص المخرجين الذين يصنعون أفلاماً منخفضة الكلفة.
لكنها ترى أن السلبيات، مثل تسهيل انتشار المعلومات المضللة المولدة بالذكاء الاصطناعي والمحتوى الإباحي، تفوق الإيجابيات. أضافت: "قد يقول البعض إن الأمر عينه ينطبق على برنامج (فوتوشوب) أو أي من الأدوات الموجودة سابقاً، ولكنني لا أتفق مع ذلك، فبرأيي الميزة الأولى للذكاء الاصطناعي أنه سهل الانتشار".
حتى الآن، يبدو أن ثمة محدودية واضحة لهذه التقنية. فقد أظهرت التجارب التي أجرتها "بلومبرغ بزنيس ويك" لبرمجيات "بيكا" و"هايبير" و"جين-2" من "رنواي" و"ستايبل فيديو" من "ستابيليتي إيه أي" أن هذه البرامج كثيراً ما تخفق في إنتاج مقاطع مصورة تتبع أوامر مكتوبة بسيطة. وفي حين لم تسنح بعد الفرصة لتجريب برنامج "سورا"، إلا أن المقاطع التي اختارتها "أوبن إيه أي" تظهر كيف أن إنتاج لقطات تحترم قوانين الفيزياء ما يزال صعباً على برامج توليد المقاطع المصورة.
استخدام التقنية لصنع فيلم طويل
يتطلب إنشاء مقاطع مصورة قدرات حاسوبية أكبر من التي يتطلبها تشغيل برامج الدردشة أو توليد الصور الثابتة، ما يجعل هذه العملية أغلى وأبطأ. بالتالي، قد تؤثر هذه التحديات التقنية على اقتصاديات تقنية توليد المقاطع المصورة، بما أن العميل هو من سيتحمل التكلفة.
يشتري عملاء "رنواي" أرصدة ينفقونها على برمجيات الشركة، وقال فالينزويلا إن العملاء يدفعون نحو دولار واحد من أجل توليد مقطع مصور مدته 20 ثانية. ويُتوقع أن تنخفض التكلفة، بما أن أسعار التقنيات عادةً ما تنخفض بمرور الوقت مع تحسن الأجهزة والبرمجيات.
وقال فالينزويلا إن استوديوهات الصور المتحركة والتأثيرات البصرية المحترفة تتقاضى ما بين 8 آلاف و25 ألف دولار لدقيقة واحدة من فيلم رسوم متحركة. وتوقع أن ينتج شخص ما فيلماً طوله 60 دقيقة على الأقل بحلول نهاية العام، يستخدم في كلّ مشهد فيه برنامج توليد مشاهد مصورة بواسطة الذكاء الاصطناعي.
من جهتها، قالت غوو إن "بيكا" ستطوّر في غضون سنة برنامجاً قادراً على توليد مقاطع مصورة من نحو دقيقة، وفي غضون سنتين قد يصبح ممكناً استخدامه في صنع فيلم طويل. مع ذلك، قد تكون لهذه البرامج تأثيرات كبرى حتى قبل أن يحدث ذلك، فكثير من المقاطع المصورة التي يشاهدها الناس في الأفلام والإعلانات ووسائل التواصل الاجتماعي لا تتعدى مدة كل منها عشر ثوان.