ابتكر باحثون من شركة مايكروسوفت أداة ذكاء اصطناعي قادرة على تحويل صورة وجه ومقطع صوتي إلى فيديو واقعي لـ«وجه يتكلّم»، وفقاً لوثيقة نشرتها شركة التكنولوجيا الكبرى هذا الأسبوع.
ويقوم البرنامج المسمى (فاسا-1) بالتقاط صورة بسيطة للوجه وتسجيل مقطع صوتي، ثم يحولهما إلى شريط فيديو يظهر وجهاً يتحرك ويتكلم بطريقة واقعية للغاية.
وأشارت الشركة إلى أن هدف الأداة لا يتمثل في إنشاء محتوى بقصد التضليل أو الخداع، مبينة أن الأداة الجديدة، على غرار أدوات ذكاء اصطناعي الأخرى، قد تُستخدم لأهداف جيدة أو مسيئة بحسب المستخدم نفسه.
ويثير النمو السريع للذكاء الاصطناعي التوليدي، الذي يتيح إنتاج مختلف أنواع المحتوى بسهولة فائقة وجودة عالية للغاية بما في ذلك النصوص والصور والأصوات، العديد من المخاوف خاصة فيما يتعلق بالاستغلال لأغراض الاحتيال والتضليل.
وأكّدت مايكروسوفت أن البحث الخاص بها يركز على الصور الرمزية والاستخدام الإيجابي لتلك الصور، لافتة إلى أنها تعارض أي سلوك يهدف إلى إنشاء محتوى مضلل أو ضار.
ونفت مايكروسوفت التي تُعد أحد المستثمرين الرئيسيين في شركة أوبن إيه اي إتاحة الأداة الجديدة أو تقديم معلومات تقنية إذا لم تتأكد من أن الأداة ستُستخدم بشكل مسؤول وفقاً للقوانين.
وتعمل شركات أخرى على هذه التقنية مثل (رنواي) إحدى الشركات المتخصصة في الذكاء الاصطناعي التوليدي للفيديو، كما أنشأ باحثون من غوغل برنامج ذكاء اصطناعي مسمى (فلوغر) قادر على إنشاء مقاطع فيديو واقعية لوجوه ناطقة.
وأشارت مايكروسوفت إلى أن الأداة الجديدة لديها عدد من الفوائد منها تعزيز المساواة في مجال التعليم ومساعدة مَن يعانون صعوبات في التواصل إضافةً إلى توفير الدعم العلاجي لمَن يحتاج إليه.