نموذج "جيميناي 1.5 برو" قادر على التعامل مع مقاطع أطول من النصوص والفيديوهات

"غوغل" تطرح نسخة محدّثة من "جيميناي" للذكاء الاصطناعي

شعار "جيميناي" على هاتف ذكي - المصدر: بلومبرغ
شعار "جيميناي" على هاتف ذكي - المصدر: بلومبرغ
المصدر:

بلومبرغ

تطرح "غوغل" التابعة لشركة "ألفابت" نسخة جديدة من نموذج الذكاء الاصطناعي العملاق الخاص بها، والذي تقول إنه قادر على التعامل مع مقادير أكبر من النصوص والفيديوهات، مقارنة بالنماذج التي تنتجها الشركات المنافسة.

نموذج الذكاء الاصطناعي المحدّث، المسمى "جيميناي 1.5 برو" (1.5 Gemini 1.5 Pro)، سوف يُطرح يوم الخميس لعملاء المنصة السحابية والمطورين حتى يتمكنوا من اختبار ميزاته الجديدة، وإنشاء تطبيقات تجارية في النهاية. أنفقت "غوغل" ومنافسوها المليارات لتعزيز قدراتهم في مجال الذكاء الاصطناعي التوليدي، وهم حريصون على جذب عملاء من الشركات لإثبات أن استثماراتهم تؤتي ثمارها.

قال أوريول فينيالز، نائب رئيس "غوغل" ورئيس قسم التكنولوجيا المشارك في "جيميناي"، خلال مؤتمر صحفي: "نركز أولاً وقبل كل شيء اليوم على استعراض البحث الذي مكّن هذا النموذج بين أيديكم. أما بالنسبة إلى الغد، فنحن متحمسون لرؤية ما سيفعله العالم بالقدرات الجديدة". قالت "غوغل" إن النسخة متوسطة الحجم من نموذج الذكاء الاصطناعي الجديد "جيميناي 1.5 برو" تعمل بمستوى مماثل لنموذج "جيميناي 1.0 ألترا" (Gemini 1.0 Ultra) الأكبر حجماً.

منذ النجاح الهائل الذي حققته شركة "أوبن إيه آي" (OpenAI) في أواخر عام 2022 من خلال برنامج الدردشة الآلية التابع لها "تشات جي بي تي"، تسعى "غوغل" إلى إبراز قوتها أيضاً في تكنولوجيا الذكاء الاصطناعي التوليدي المتطورة، والتي يمكنها إنشاء نصوص أو صور أو حتى مقاطع فيديو جديدة بناءً على أوامر المستخدم. قامت المزيد من الشركات بتجربة هذه التكنولوجيا، والتي يمكن استخدامها لأتمتة المهام، مثل البرمجة، أو تلخيص التقارير، أو إنشاء حملات تسويقية.

أطلقت "غوغل" نموذج الذكاء الاصطناعي "جيميناي" في ديسمبر الماضي بثلاثة إصدارات، مما يسمح بتخصيصه ليناسب المهمة المستهدف إنجازها، ويمكن تشغيله على كافة المنصات بدءاً من الأجهزة المحمولة وحتى مراكز البيانات واسعة النطاق. يعد "جيميناي" بمثابة رد "غوغل" على التحالف القوي بين كلٍ من "مايكروسوفت" و"أوبن إيه آي"، والذي يقول البعض إنه كان الأسرع في الاستفادة من طفرة الذكاء الاصطناعي الحالية، بما في ذلك عملاء المنصة السحابية والمطورين.

أدوات أكثر قوة

أما الآن، تسعى "غوغل" إلى جذب هؤلاء المستخدمين إلى منظومتها هذه باستخدام أدوات أكثر قوة. يمكن تدريب "جيميناي 1.5" بشكل أسرع وأكثر كفاءة، ولديه القدرة على معالجة كمية هائلة من المعلومات في كل مرة يتلقى فيها أوامر للقيام بذلك، وفق فينيالس. على سبيل المثال، يمكن للمطورين استخدام "جيميناي 1.5 برو" للاستعلام عن فيديو تصل مدته إلى ساعة، أو ملف صوتي مدته 11 ساعة، أو مستند يضم أكثر من 700 ألف كلمة، وهي كمية من البيانات تقول "غوغل" إنها "أطول نافذة سياقية" من أي نموذج ذكاء اصطناعي واسع النطاق حتى الآن. يستطيع "جيميناي 1.5" معالجة المزيد من البيانات، مقارنة بما يمكن لأحدث نماذج الذكاء الاصطناعي من "أوبن إيه آي" و"أنثروبيك" (Anthropic) التعامل معه، وفقاً لـ"غوغل".

أظهرت "غوغل" من خلال عرض فيديو مسجل مسبقاً أعدته للصحفيين، كيف طلب المهندسون من "جيميناي 1.5 برو" استيعاب نسخة مستند بصيغة "PDF" مكونة من 402 صفحة تتناول هبوط "أبولو 11" على سطح القمر، ثم طلبوا منه إيجاد اقتباسات من المستند تظهر "ثلاث لحظات فكاهية". تشير إحدى الإجابات من نموذج الذكاء الاصطناعي هذا إلى أنه بعد مرور خمس ساعات على نص مهمة "أبولو 11"، قال رائد الفضاء مايكل كولينز لمركز التحكم في المهمة: "إذا تأخرنا في الرد عليكم، فذلك لأننا نتناول شطائر".

في عرض توضيحي آخر مسجل مسبقاً، طلب مهندسو "غوغل" من "جيميناي 1.5 برو" العثور على مشهد معين في فيلم "باستر كيتون" مدته 44 دقيقة، استناداً لوصف تقريبي للمشهد الذي يتذكرونه. نجح "جيميناي" في العثور على المشهد، مشيراً إلى أنه تم الوصول إليه بعد حوالي 15 دقيقة من الفيديو.

مرحلة اختبار

مع ذلك، نبّهت "غوغل" من أن الردود، شأنها شأن جميع النماذج التوليدية، ليست مثالية دائماً. فلا يزال "جيميناي 1.5 برو" عُرضة للانخداع، ويعمل ببطء في بعض الأحيان ولا يفهم دائماً ما يقصده المستخدمون، مما يضطرهم إلى طرح أسئلتهم بطرق مختلفة قبل أن يأتي النموذج بالإجابة الصحيحة. قال فينيالس إن الشركة "تعمل على تحسين" أداء "جيميناي 1.5" لجعله أسرع، وأنه "لا يزال في مرحلة تجريب وبحث".

قالت الشركة إن المطورين يمكنهم استكشاف "جيميناي 1.5 برو" باستخدام "غوغل إيه آي استوديو" (Google AI Studio)، بينما يمكن لبعض عملاء المنصة السحابية الوصول إلى نموذج الذكاء الاصطناعي من خلال معاينة خاصة على منصة المؤسسات "فيرتكس إيه آي" (Vertex AI). ذكرت "غوغل" أيضاً يوم الخميس أنها ستوسع الوصول إلى نموذجها "جيميناي 1.0 ألترا" (Gemini 1.0 Ultra) واسع النطاق، مما يتيح النموذج أمام عدد أكبر من العملاء العالميين على "فيرتكس إيه آي".

اضغط هنا لقراءة المقال الأصلي
تصنيفات

قصص قد تهمك