في 29 مايو ، سنبدأ دورة
Python Neural Networks ، التي تتحدث عن التعلم الآلي العميق وتعلمك كيفية حل المهام الأكثر تعقيدًا التي يديرها مهندس تعلم عميق. لإظهار مدى اهتمام العمل ومتعدد الأوجه في مجال التعلم الآلي ، نقترح عليك أن تتعرف على سلسلة من ترجمات المقالات حول موضوع الشبكات العصبية في بيثون.

ما هي موسنيت؟
لقد أنشأنا وقدمنا لك MuseNet - شبكة عصبية عميقة يمكنها إنشاء مؤلفات موسيقية مدتها أربع دقائق باستخدام عشرة آلات مختلفة. تجارب MuseNet من خلال الجمع بين الأساليب الموسيقية المختلفة: من البلاد إلى روائع Mozart والزيارات الخالدة لـ The Beatles.
أساس الشبكة ليس من السهل إدراكنا وفهمنا للموسيقى ، بل القدرة على العثور على نماذج من الانسجام والإيقاع والأناقة في مئات الآلاف من ملفات MIDI ، ومن ثم إنشاء أعمالك الخاصة. تستخدم شبكة MuseNet Neural Network نفس تقنية GPT-2 - وهو نموذج واسع النطاق تم تدريبه على التنبؤ بأفضل التتابعات في كل من النص والصوت. تتيح معرفة العديد من الأنماط للشبكة إنشاء مجموعات فريدة تمامًا من الموسيقى من مختلف الأجيال.
الملحن والرموز الآلية
أنشأنا رموزًا للملحنين ومختلف الآلات الموسيقية لمنح MuseNet أقصى قدر من التحكم في العينات التي تنشئها الشبكة. أثناء التدريب ، تتم إضافة رموز الملحنين والأدوات إلى كل عينة ، مما يساعد الشبكة على تعلم استخدام هذه المعلومات في التنبؤ.
هيكل طويل الأجل
تستخدم MuseNet النوى المحسنة والمحسّنة في
Sparse Transformer لتدريب الشبكة ذات المستوى 72. في رأينا ، يعد الجيل الموسيقي مكانًا ناجحًا جدًا لاختبار وتطوير قدرات Sparse Transformer.
جمع البيانات ومعالجتها
قمنا بجمع البيانات لتدريب MuseNet في مجموعة متنوعة من المصادر.
ساعدتنا مشاريع
ClassicalArchives و
BitMidi كثيرًا ،
ووضعوا مجموعاتهم الضخمة تحت تصرفنا. كما استخدمنا مجموعات من الموسيقى المختلفة الموجودة على الإنترنت: موسيقى الجاز وموسيقى البوب والموسيقى الإفريقية والهندية والعربية. بالإضافة إلى ذلك ، استخدمنا مجموعة
MAESTRO .
يتم التدريب على البيانات التسلسلية ، مع مراعاة مجموعة الرموز ، نطلب من الشبكة التنبؤ بالرمز التالي. لقد حاولنا استخدام عدة طرق مختلفة لترميز ملفات MIDI. في البداية ، فكرنا في طريقة الدردشة الجماعية ، والتي نظرت في كل مجموعة من الملاحظات التي تبدو في وقت واحد وترًا منفصلاً وتعيين الرمز المميز المقابل. حاولنا أيضًا تكثيف الأنماط الموسيقية ، مع التركيز على بداية كل ملاحظة.
bach piano_strings start tempo90 piano:v72:G1 piano:v72:G2 piano:v72:B4 piano:v72:D4 violin:v80:G4 piano:v72:G4 piano:v72:B5 piano:v72:D5 wait:12 piano:v0:B5 wait:5 piano:v72:D5 wait:12 piano:v0:D5 wait:4 piano:v0:G1 piano:v0:G2 piano:v0:B4 piano:v0:D4 violin:v0:G4 piano:v0:G4 wait:1 piano:v72:G5 wait:12 piano:v0:G5 wait:5 piano:v72:D5 wait:12 piano:v0:D5 wait:5 piano:v72:B5 wait:12
أثناء التدريب ، نحن:
- نقوم بنقل الملاحظات على مقياس درجة (أثناء التدريب ، يتناقص عدد عمليات النقل) ؛
- نضيف ونخفض الصوت الكلي وصوت العينات الفردية ؛
- نعمل مع التوقيت: نسرع ونبطئ الأجزاء الفردية من التكوين ؛
- نستخدمها للعمل مع الرموز المختلطة.
بالإضافة إلى ذلك ، نستخدم شيئًا ما مثل الناقد الموسيقي المدمج: نطلب منه تقييم التركيبة وتحديد ما إذا كان يتم إنشاء هذه العينة من البيانات المقدمة أم أنها قديمة. مثل هذا التقدير يجعل من الممكن اختيار العينات في مسار التوليد.
التكامل
لجعل النموذج يحتوي على سياق أكثر هيكلية ، أضفنا التكامل. بالإضافة إلى عمليات التكامل الموضعية القياسية ، أضفنا عمليات تكامل تتبع تدفق الوقت في العينات. هذا يسمح لك بشكل صحيح وفي وقت واحد بتضمين الملاحظات السبر. لقد أضفنا أيضًا تكاملين هيكليين يسمحان لـ MuseNet بفهم أي جزء من التكوين الكلي يجب تحديد موقعه.
MuseNet بالفعل يعطي الحفلات الموسيقية
يمكن للمهتمين التعرف على عمل MuseNet ، حتى أن الشبكة العصبية
تقدم حفلات موسيقية خاصة بها عبر الإنترنت على Twitch . بالنسبة لأولئك الذين يرغبون في إنشاء شبكات عصبية في بيثون والتعلم الآلي العميق ، فإننا نقوم بإجراء
ندوة عبر الإنترنت مفتوحة حيث سنتحدث عن برنامج الدورة والمهارات التي سيتلقاها الطلاب.