عرضت شركة إنفيديا يوم الاثنين نموذج ذكاء اصطناعي جديداً لتوليد الموسيقى والصوت يمكنه تعديل الأصوات وتوليد أصوات جديدة، وهي تقنية تستهدف منتجي الموسيقى والأفلام وألعاب الفيديو.
وقالت إنفيديا، أكبر مورد في العالم للرقائق والبرمجيات المستخدمة لإنشاء أنظمة الذكاء الاصطناعي، إنها لا تخطط لإطلاق التكنولوجيا علناً فوراً، والتي أطلقت عليها اسم Fugatto، وهو اختصار لـFoundational Generative Audio Transformer Opus 1.
وتنضم هذه التقنية إلى تقنيات أخرى أظهرتها شركات ناشئة مثل رانواي وشركات أكبر مثل ميتا بلاتفورمز، والتي يمكنها توليد الصوت أو الفيديو من موجه نصي، وفقاً لرويترز.
تولد نسخة إنفيديا، التي يقع مقرها في سانتا كلارا بولاية كاليفورنيا، المؤثرات الصوتية والموسيقى من وصف نصي، بما في ذلك الأصوات الجديدة مثل جعل البوق ينبح مثل الكلب.
ما يميزها عن تقنيات الذكاء الاصطناعي الأخرى هو قدرتها على استيعاب وتعديل الصوت الموجود، على سبيل المثال عن طريق أخذ جزء يعزف على البيانو وتحويله إلى غناء بصوت بشري، أو عن طريق أخذ تسجيل صوتي منطوق وتغيير اللهجة المستخدمة أو طريقة التعبير المستخدمة.
قال برايان كاتانزارو، نائب رئيس أبحاث التعلم العميق التطبيقي في إنفيديا «إذا فكرنا في الصوت الاصطناعي على مدى السنوات الخمسين الماضية، فإن الموسيقى تبدو مختلفة الآن بسبب أجهزة الكمبيوتر، وبسبب أجهزة التوليف»، وأضاف «أعتقد أن الذكاء الاصطناعي التوليدي سيجلب قدرات جديدة للموسيقى وألعاب الفيديو والأشخاص العاديين الذين يريدون إنشاء أشياء».
بينما تتفاوض شركات مثل أوبن إيه آي مع استوديوهات هوليوود حول إمكانية وكيفية استخدام الذكاء الاصطناعي في صناعة الترفيه، أصبحت العلاقة بين التكنولوجيا وهوليوود متوترة، خاصة بعد أن اتهمت نجمة هوليوود سكارليت جوهانسون أوبن إيه آي بتقليد صوتها.
دُرب نموذج إنفيديا الجديد على بيانات مفتوحة المصدر، وقالت الشركة إنها لا تزال تناقش ما إذا كانت ستطلقه علناً وكيفية القيام بذلك.
قال كاتانزارو «إن أي تقنية توليدية تحمل دائماً بعض المخاطر، لأن الناس قد يستخدمونها لتوليد أشياء نفضل ألّا يفعلوها»، وأضاف «نحن بحاجة إلى توخي الحذر بشأن ذلك، ولهذا السبب ليس لدينا خطط فورية لإطلاق هذا».
لم يحدد مبتكرو نماذج الذكاء الاصطناعي التوليدي بعد كيفية منع إساءة استخدام التكنولوجيا مثل قيام المستخدم بإنشاء معلومات مضللة أو انتهاك حقوق الطبع والنشر من خلال إنشاء شخصيات محمية بحقوق الطبع والنشر.
وبالمثل، لم تعلن أوبن إيه آي وميتا عن موعد إطلاق نماذجهما التي تولد الصوت أو الفيديو للجمهور.