Cover

ميدار.نت - نيويورك

أعلنت صحيفة نيويورك تايمز الأمريكية أن شركة OpenAI قامت بتدريب نموذجها الجديد للذكاء الاصطناعي، GPT-4، على محتوى يوتيوب، وذلك وفقاً لما أوردته الصحيفة في تقريرها الأخير.

وتطلّبت عملية التدريب التي قامت بها OpenAI بيانات ضخمة، ولتلبية هذه الحاجة، قامت الشركة بتطوير نموذج النسخ الصوتي Whisper الذي يقوم بتحويل الصوت في مقاطع الفيديو على يوتيوب إلى نصوص.

وتم استخدام هذه النصوص في تدريب نموذج GPT-4، الذي يُعتبر واحداً من أبرز إنجازات الشركة حتى الآن.

 

تحديات قانونية

وتثير هذه الخطوة تساؤلات قانونية، حيث تقع في منطقة رمادية من حيث قانون حقوق الطبع والنشر للذكاء الاصطناعي، إلا أن OpenAI تصر على أن هذا الاستخدام يعتبر "عادلاً".

وشارك الرئيس التنفيذي لـ OpenAI، جريج بروكمان، بنفسه في جمع البيانات التي استخدمت في عملية التدريب، وذلك وفقاً لصحيفة نيويورك تايمز.

 

مصادر متنوعة

ومن جانبها، صرحت المتحدثة باسم OpenAI، ليندساي هيلد، لموقع The Verge التقني أن الشركة تعتمد على "مصادر عديدة بما في ذلك البيانات العامة والشراكات للبيانات الخاصة".

ويُذكر أن OpenAI كانت قد دربت نماذجها في السابق على مصادر بيانات متنوعة، مثل الأكواد البرمجية على Github والمحتوى التعليمي على منصة Quizlet.

وفي حديث أخير، حذر الرئيس التنفيذي لـ يوتيوب OpenAI من استخدام نموذجها الجديد لتحويل النصوص إلى مقاطع فيديو على منصتهم، مما يبرز التحديات والآفاق المستقبلية لهذه التقنية.