نموذج veo تطلقه جوجل لتوليد الفيديو بالذكاء الصناعي للشركات، إذ أعلنت جوجل عن توفر نموذج veo جديد لتوليد الفيديو باستخدام الذكاء الصناعي حتى تتمكن الشركات من الاندماج في إنتاج المحتوى. كذلك نموذج Imagen 3 لتوليد الصور وذلك وفق بيان نشرته على موقعها الرسمي. بالتالي عبر موقع mrmagazin سنتعرف على ما هو نموذج veo الذي أطلقته جوجل.
نموذج veo تطلقه جوجل لتوليد الفيديو بالذكاء الصناعي للشركات
يأتي الإطلاق بعد الإعلان عن النموذج الأولي في شهر أيار مايو الماضي ، وبعد أن قدم OpenAI نموذجا منافسا واطلقت عليه اسم Sora. ومع ذلك فأن جوجل تفوقت لدى إطلاق نموذج veo عبر منصة Vertex AI ، بينما لا يزال نموذج Sora قيد التطوير.
يمكن لنماذج فيو استخدام أوامر نصية أو صورة لإنشاء فيديو بدقة 1080 بكسل وفق مجموعة متنوعة من الأنماط المرئية والسينمائية.
في بداية العام عندما تم الإعلان عن النموذج تجاوزت المقاطع المنتجة طول حوالي دقيقة تقريبًا، لكن جوجل لم تضع حدود لطول الفيديو في النسخة التجريبية. وأظهرت المقاطع الجديدة التي كشفت عنها جوجل نتائج كان من الصعب تمييزها عن مقاطع الفيديو الحقيقية. ومن الأمثلة البارزة على ذلك مقطع فيديو لكلب يظهر تفاصيل دقيقة بحيث ظل نمط الفراء والياقة ثابتا أثناء حركته ، مما يعكس قوة النموذج الذي ينتج مقاطع عالية الجودة.
ما هو نموذج Imagen 3
بالإضافة إلى فيو، ستجعل جوجل أحدث إصدار من نموذج Imagen 3 تحويل النص إلى صورة متاحا لجميع عملاء خدمات جوجل السحابية Google Cloud عبر منصة Vertex وذلك اعتبارًا من الأسبوع المقبل بعد إطلاقه لأول مرة في الولايات المتحدة المنصة التجريبية AI Test Kitchen في أغسطس الماضي
أيضًا، ستقدم جوجل ميزات جديدة مثل تحرير الصور بناء على أوامر نصية وإضافة الشعارات والعناصر الخاصة بالمستخدم إلى الصور التي تم إنشاؤها.
وعرضت جوجل نموذجًا لمقطع فيديو دعائي لشركة السياحة والسفر Agoda، وظّفت فيه نماذج الذكاء الاصطناعي الجديدة Veo و Imagen 3
ملخص حول نموذج veo ونموذج Imagen 3
لا يخلو نموذج فيو من العيوب في الميزات المتقدمة ، مثل عيوب الإضاءة التي تظهر في الفيديو كما حدث في أحد المقاطع التجريبية لأن الضوء اخترق يد الإنسان بطريقة غير طبيعية. ومع ذلك، أكدت جوجل أن النموذجين مجهزين بآليات حماية لمنع توليد محتوى ضار أو انتهاك حقوق الملكية الفكرية. لذلك ضمّنت جوجل تقنية SynthID من DeepMind لتكون علامة مائية رمية غير مرئية مصممة لتقليل مخاطر المعلومات الخاطئة وتمييز المحتوى الذي تم إنشاؤه أو تعديله بواسطة الذكاء الاصطناعي.
في الختام، مع إطلاق نموذج فيو تجد OpenAI أن الوقت قد تأخر لأنها لم تفي بعد بوعدها بإطلاق طراز Sora بحلول نهاية عام 2024. ومع زيادة استخدام المحتوى المنتج بالذكاء الصناعي في الحملات الإعلانية تشير بيانات جوجل أن 86 ٪ من المؤسسات التي تستخدم الذكاء الصناعي حصلت على نمو في الإيرادات مما يعطي الشركات حافز كبير لتبني تقنية جوجل دون انتظار المنافسين.