تكنولوجيا استنساخ الصوت OpenVoice تنطلق مفتوحة المصدر

Cover

ميدار.نت - أوتاوا

أعلنت شركة MyShell الكندية الناشئة في مجال الذكاء الاصطناعي عن إطلاق النموذج الجديد لاستنساخ الصوت مفتوح المصدر، والذي يحمل اسم OpenVoice.

ويأتي هذا النموذج كنتاج لتعاون فريق MyShell مع معهد ماساتشوستس للتكنولوجيا (MIT) وجامعة تسينغهوا في بكين، الصين.

وتتميز تقنية OpenVoice بسرعة استجابتها وقدرتها على تقديم تحكم دقيق في استنساخ الصوت، مما يجعلها تبرز بين منصات الاستنساخ الصوتي الأخرى.

وأكّدت شركة MyShell على دقة الاستنساخ وتحكمها الكامل في النغمة، من العواطف إلى اللهجة والإيقاع.

 

تجربة استنساخ دقيقة

وأعلنت MyShell عن إطلاق OpenVoice عبر منشور رسمي على منصة X، حيث أشارت إلى أنها توفر تجربة استنساخ دقيقة للأصوات بجودة لا مثيل لها.

وقدّمت الشركة كذلك روابط لورقة بحثية مراجعة تشرح تطوير OpenVoice، مع إمكانية تجربة البرنامج عبر واجهة تطبيق الويب MyShell ومنصة HuggingFace.

وفيما يتعلق برؤية MyShell، أكد Zengyi Qin، أحد الباحثين الرئيسيين في MIT وMyShell، أن هدفهم هو توفير الذكاء الاصطناعي للجميع.

وأشار إلى أن الشركة تسعى لدعم مجتمع البحوث مفتوح المصدر من خلال تقديم منح ومجموعات البيانات والقدرات الحاسوبية.

وتم الإعلان عن دعوة للمشاركة في مخطط حوكمة الذكاء الاصطناعي في العاشر من يناير، وذلك في حدث VentureBeat لتأثير الذكاء الاصطناعي.

ويعتبر استخدام تقنية OpenVoice سهلاً وفعالاً، حيث يمكن للمستخدمين إنشاء نسخ صوتية مقنعة بسرعة وبسهولة، دون الحاجة إلى قراءة نص محدد لتحليل الصوت.

ويوفر النموذج أيضاً إمكانية تعديل "الأسلوب" بسهولة، مما يسمح بتغيير اللون الصوتي لتناسب المشاعر المختلفة.

 

تطوير OpenVoice

ووصف النموذجين - TTS ومحول النغمات - في ورقة البحث العلمية، حيث يتحكم الأول في معلمات الأسلوب واللغات، بينما يركز الثاني على تحويل النغمات وقد تم تدريبه على عينات صوتية متنوعة.

ويظهر OpenVoice كابتكار مميز في مجال استنساخ الصوت مفتوح المصدر، مع توقعات لمزيد من التطورات والتحسينات في هذا المجال المتطور.