يبدو أن الذكاء الاصطناعي، لم يصل بعد إلى قمة الإمكانيات التي يمكن أن يتيحها لينافس الوظائف التقليدية، فقد طورت «جوجل» نموذج جديد من «جيمناي» لمونتاج وتوليد مقاطع الفيديو باستخدام الذكاء الاصطناعي.
وأعلنت جوجل في مؤتمر الأخير للمطورين، وفقًا لوكالات، عن عائلة نماذج “جيميناي أومني” (Gemini Omni)، يبدأ أولها بنموذج “أومني فلاش” (Omni Flash)، لتقدم تجربة توليد ومونتاج مقاطع الفيديوهات من خلال التعامل مع عدد من المدخلات منها الصور ومقاط الفيديو والنصوص.
ولا تتطلب النماذج الجديدة من المستخدم كتابة أوامر نصية معقدة وطويلة بل تمنحه القدرة على توليد مقاطع الفيديو بناء على أي نوع من المدخلات وعناصر الفيديو.
ويستطيع المستخدم من خلال “جيميناي أومني” التعامل مع الصور والنصوص ومقاطع الفيديو على حد سواء لتتمكن من توليد مقاطع فيديو احترافية تحافظ على المحتوى والشخصيات الموجودة في المواد الأصلية.
ويعني هذا إن قمت برفع صورة مباشرة إلى الأداة، فإنك تستطيع توليد مقطع فيديو للشخص أو الأشكال الموجودة في الصورة واستخدامها بكل تفاصيلها داخل المقطع دون خسارة أي شيء.
وتفتح هذه القدرة أمام مستخدمي “أومني” مجموعة كبيرة ومتنوعة من الاستخدامات التي لم تكن موجودة في السابق وكانت تتطلب مستوى احترافيا في كتابة الأوامر الموجهة للذكاء الاصطناعي.
توجد العديد من الاستخدامات التي يمكن الاستفادة من “أومني” فيها، بدءا من إمكانية تعديل مقاطع الفيديو الموجودة مسبقا، وفق تقرير موقع “تيك كرانش” (Tech Crunch) التقني الأمريكي.
وإلى جانب ذلك، تستطيع تعديل الصور على غرار أداة “نانو بانانا برو” (Nanno Banana Pro) باستخدام “أومني” مباشرة والاستفادة أيضا من القدرات المتطورة للأداة.
ولا تحتاج عملية تعديل أو مونتاج مقاطع الفيديو إلى أي مهارات أو قدرات خاصة، يكفي فقط أن تصف لـ”أومني” ما ترغب بتعديله في المقطع لتقوم هي تلقائيا بتعديل المقطع ثم تحويله إلى مقطع جديد جاهز للمشاركة.
كما يوفر النموذج للمستخدمين القدرة على توليد صورة رمزية حقيقية “أفاتار” تشبه المستخدم بشكل متطابق إلى جانب استخدام درجات الصوت ذاتها للمستخدم، ثم تستطيع تحريك هذه الصورة واستخدامها في مقاطع الفيديو كما ترغب، وفق تقرير “تيك كرانش”.