تقنية

مايكروسوفت تعمل على أداة ذكاء اصطناعي تحول صورة ومقطعا صوتيا إلى “وجه ناطق”

قام باحثون في شركة مايكروسوفت بتطوير أداة ذكاء اصطناعي تستطيع تحويل صورة للوجه ومقطع صوتي إلى فيديو واقعي يبدو وكأن الوجه يتكلم، وفقاً لوثيقة نُشرت هذا الأسبوع من قبل الشركة التكنولوجية العملاقة.

أوضحت الشركة أن هدف هذه الأداة ليس إنشاء محتوى لأغراض التضليل أو الخداع، مؤكدة أنها قد تستخدم بشكل سلبي كما هو الحال مع تقنيات أخرى لإنشاء المحتوى.

تثير التطورات السريعة في مجال الذكاء الاصطناعي التوليدي، التي تمكن من إنتاج محتوى متنوع بجودة عالية، مخاوف عديدة بخصوص إمكانية استخدامها في الاحتيال والتضليل.

أكدت مايكروسوفت أن بحثها يركز على استخدام الصور الرمزية الافتراضية (الأفاتار) بشكل إيجابي، وتعارض أي استخدام يهدف إلى الخداع أو الضرر.

لا تنوي الشركة توفير الأداة الجديدة في الوقت الحالي أو تقديم معلومات تقنية إضافية بسبب عدم اليقين بشأن كيفية استخدامها بمسؤولية وفقًا للقوانين المعمول بها.

يعمل برنامج “فاسا-1” على التقاط صورة للوجه وتسجيل مقطع صوتي، ثم تحويلهما إلى فيديو يظهر وجهًا يتحرك ويتكلم بطريقة واقعية للغاية.

تعمل شركات أخرى مثل “رنواي” في مجال تقنية الذكاء الاصطناعي التوليدي للفيديو، وقد أنشأ باحثون في جوجل برنامجًا يسمى “فلوغر” قادرًا على إنشاء مقاطع فيديو واقعية لوجوه تتكلم.

أشارت مايكروسوفت إلى فوائد هذه التقنية مثل دعم المساواة في التعليم ومساعدة ذوي الصعوبات في التواصل وتقديم الدعم العلاجي للأشخاص الذين يحتاجونه، مما يبرر العمل على تطويرها.

زر الذهاب إلى الأعلى