كشفت شركة إنفيديا عن نموذج ذكاء اصطناعي جديد تجريبي أطلقت عليه اسم “Foundational Generative Audio Transformer Opus 1″، ويُعرف اختصارًا بـ”Fugatto“، وهو نموذج مخصص للصوت بنحو أساسي.
ويتميز هذا النموذج بقدرته على إنشاء أصوات أو تعديل الموسيقى والصوتيات والملفات الصوتية بناءً على الأوامر النصية. وقد طوّر Fugatto فريق من الباحثين في مجال الذكاء الاصطناعي من مختلف أنحاء العالم، مما عزز قدراته المتعددة اللهجات واللغات.
وقال رافاييل فالي، أحد الباحثين وراء المشروع، ومدير أبحاث الصوت التطبيقية في إنفيديا: “أردنا تصميم نموذج يفهم الصوت وينتجه كما يفعل البشر”.
وأشارت الشركة في بيانها إلى عدد من الاستخدامات العملية للنموذج، مثل تمكين منتجي الصوت من إنشاء نماذج أولية للأفكار الموسيقية بسرعة، مع إمكانية تعديلها بسهولة لتجربة أنماط وأصوات وآلات موسيقية مختلفة.
ويمكن للنموذج أن يُستخدم في تطوير أدوات تعليمية للّغات بصوت مخصص حسب الطلب، ويمكن لمطوري ألعاب الفيديو إنشاء نسخ متعددة من الأصول الصوتية المسجلة سابقًا لتتوافق مع تغييرات اللعبة التي تحدث بناءً على اختيارات اللاعبين وأفعالهم.
وعلاوةً على ذلك، اكتشف الباحثون أن النموذج قادر على تنفيذ مهام غير مدرجة ضمن تدريبه الأولي بعد إجراء تعديلات بسيطة. على سبيل المثال: يمكنه توليد كلام غاضب بلكنة معينة أو إنشاء صوت عصافير تغرد وسط عاصفة رعدية. ويمتاز Fugatto أيضًا بقدرته على توليد أصوات تتغير مع مرور الوقت، مثل صوت القطار في أثناء تحركه عبر منطقة ما.
ولم توضّح إنفيديا إذا كانت ستتيح النموذج لعامة الجمهور. ولا يُعد Fugatto النموذج الأول من نوعه؛ إذ أطلقت شركة ميتا سابقًا مجموعة أدوات ذكاء اصطناعي مفتوحة المصدر لإنشاء الأصوات من أوصاف نصية، كما توفر جوجل نموذجها الخاص لتحويل النص إلى أصوات، MusicLM.