مايكروسوفت تعمل على أداة ذكاء اصطناعي تحول صورة ومقطعا صوتيا إلى "وجه ناطق"
تقنية مايكروسوفت الجديدة لتحويل الوجوه والصوتيات إلى فيديوهات
ابتكرت مايكروسوفت أداة ذكاء اصطناعي مذهلة قادرة على تحويل صورة وجه ومقطع صوتي إلى فيديو واقعي لشخص يتحدث. تهدف هذه الأداة إلى تعزيز التواصل والحد من التضليل.
تعتمد الأداة، المسماة VASA-1، على تقنيات الذكاء الاصطناعي التوليدي المتقدمة. تأخذ صورة وجه بسيطة ومقطعًا صوتيًا وتدمجهما لإنشاء فيديو واقعي لشخص متحرك يتحدث. وتعمل شركات أخرى أيضًا على تقنيات مماثلة، مثل Runway و Google.
تؤكد مايكروسوفت أن استخدام هذه التقنية يتمحور حول الاستخدامات الإيجابية، مثل تحسين إمكانية الوصول إلى التعليم ومساعدة الأشخاص الذين يعانون من صعوبات في التواصل. ومع ذلك، فهي تدرك أيضًا المخاطر المحتملة للإساءة والتضليل، وتتخذ إجراءات لضمان الاستخدام المسؤول للأداة.
الفوائد المحتملة للابتكار
- تعزيز المساواة في التعليم: يمكن استخدام مقاطع الفيديو المتحدثة لأتمتة العروض التقديمية والمحاضرات، مما يجعل التعليم أكثر سهولة للطلاب الذين قد يواجهون صعوبات في التعلم التقليدي.
- مساعدة ذوي صعوبات التواصل: يمكن أن توفر الأداة وسيلة جديدة للأشخاص الذين يواجهون صعوبة في الكلام أو التواصل للتعبير عن أنفسهم بشكل فعال.
- تقديم الدعم العلاجي: يمكن استخدام مقاطع الفيديو المتحدثة لتقديم الدعم العاطفي للأفراد الذين قد يواجهون صعوبات في التعبير عن مشاعرهم أو التواصل مع الآخرين.
وتجدر الإشارة إلى أن مايكروسوفت لا تعتزم إصدار الأداة أو تقديم معلومات تقنية عنها حتى تتوصل إلى طريقة لضمان استخدامها بشكل مسؤول وبما يتماشى مع اللوائح المعمول بها.
تم نشر هذا المقال بواسطة تطبيق عاجل
التطبيق الأول لمتابعة الأخبار العاجلة في العالم العربي
اضغط لتحميل التطبيق الآن مجاناً