كيفية رسم وقراءة الصوت
تصوير ماثيو بوتر CC-BYكيفية توصيل المعلومات الصوتية والمرئية؟ غالبًا ما يطرح هذا السؤال العلماء والهواة من جميع أنحاء العالم. لذا ، في فبراير 2006 ، انتشرت الأخبار التي تمكن العلماء من إعادة إنتاج أصوات من وعاء طيني يزيد عمره عن 6500 سنة بسرعة عبر الإنترنت.يُزعم أن الخزاف طبق إيقاعًا موسيقيًا على الوعاء أثناء تصنيعه. لسوء الحظ ، تبين أن هذه مزحة فاشلة من كذبة أبريل على التلفزيون البلجيكي.ومع ذلك ، تمكن باتريك فيستر من معالجة السجل ، الذي تجاوز عمره 1000 عام. بهذه المناسبة ، في مايو 2011 ، تحدث في مؤتمر جمعية مجموعات الصوت المسجلة (ARSC) مع افتتاح "paleospectrophony".غمر نفسك في التاريخ: تدوين السجلات السابقة
يستخدم باتريك التكنولوجيا الحديثة (في هذه الحالة ، ليست حديثة بشكل خاص ، منذ اختراع الطيف الطيفي منذ فترة طويلة) من أجل تحويل الأشياء المرئية إلى أشياء سليمة. ومع ذلك ، لم تكن البشرية تسير دائمًا بهذه الطريقة وحاولت ، على العكس من ذلك ، "التقاط" الصوت في الصور.لفترة طويلة (قبل إنشاء الفونوغراف من قبل توماس إديسون) ، كان الناس قلقين بشأن السؤال: كيف يمكن التوصل إلى طريقة لإصلاح الموسيقى التي تساعد الشخص الذي يشاهد التسجيل على تشغيل اللحن في رؤوسهم بسهولة كما يفعل الموسيقيون المحترفون عند النظر إلى النتيجة. لسوء الحظ ، وفقًا للدكتور فيستر ، فإن هذه المهمة غير قابلة للتحقيق من حيث المبدأ ، لأن دماغنا في معظم الحالات ليس جيدًا بما يكفي في تحويل المعلومات المرئية إلى صوت.ربما لم يكلل حل هذه المشكلة في الماضي بالنجاح ، لكن التاريخ ترك لنا الكثير من الأدلة حول كيف حاول الناس في العصور المختلفة إنشاء أنظمة تسجيل صوتي مماثلة. شكلت أشهر هذه الأنظمة أساس الفونوغراف - سلف الفونوغراف ، الذي اخترعه الفرنسي إدوارد مارتينفيل. جهاز التصوير الصوتي هو جهاز يمر فيه الصوت عبر مخروط ، مما يتسبب في اهتزاز الغشاء المتصل بالإبرة. بدورها ، رسمت الإبرة خطوطًا تشبه الموجة على أسطوانة زجاجية مغطاة بورق هادئ.بمساعدة تسجيل صوتي فونو ، يمكن التقاط الصوت ، ولكن لم يكن هناك طريقة لإعادة إنتاجه. هذه هي المشكلة التي قرر Fister. في عام 2008 ، اجتمع هو وزملاؤه وخبير الصوت ديفيد جيوفانوني في مختبر لورانس بيركلي الوطني لفك رموز إحدى أفضل الصور الصوتية المحفوظة في Martenville.طور مختبر لورانس تقنيات لاستخراج الأصوات من صور عالية الجودة تلتقط صورًا لوسائط الشمع الهشة أو الأقراص المكسورة. باستخدام هذه التقنيات ، تلقى العلماء من التسجيل الصوتي تسجيل أغنية "Moonlight" ("Au Clair de la Lune") ، التي تم إنتاجها عام 1860. ويعتقد أن هذا هو السجل الأول الذي يمكننا من خلاله تمييز الصوت البشري.ومع ذلك ، لم يكن حل هذه المشكلة كافيًا لـ Fister: في وقت لاحق ، لم يسجل الصوت فقط من أكثر من 50 تسجيلًا صوتيًا ، ولكنه حقق أيضًا في محاولات سابقة "لتسجيل الصوت". غريب كما قد يبدو ، ساعدت خدمة كتب Google هذا العالم. باستخدامه ، كتب Fister أحرفًا من الكتب التي تم تجاهلها باستمرار ، واعتبرت المراوغات التاريخية.وجد أقدم خط متموج في كتاب 1806. من خلال تقنيات أخرى ، تمكن من فك لحن 1677 ، الذي تم تسجيله من قبل العديد من النقاط. تم اكتشاف آخر في سجلات القرن العاشر ، حيث أظهرت الخطوط ما هو المفتاح الذي يجب أن يغنى. يمكن العثور على أمثلة لمثل هذه الإدخالات على موقعه الصوتي .نهج آخر
يتبع الباحثون من MIT و Microsoft و Adobe مسارًا مختلفًا: يعيدون بناء الصوت من صورة متحركة (أو بالأحرى اهتزاز). طور الباحثون خوارزمية للحصول على إشارة صوتية من الاهتزازات المسجلة على الفيديو.في إحدى هذه التجارب ، تمكنوا من استخراج الكلام المقروء من تسجيل حزمة فارغة من تحت الرقائق. في عدد من التجارب الأخرى ، يمكن القيام بنفس الشيء مع سطح رقائق الألمنيوم وكوب من الماء وحتى مع أوراق نبات منزلي. في عام 2014 ، قدم الفريق إنجازاتهم في مؤتمر Siggraph السنوي. ( فيديو من عرض قدمه أحد الباحثين الذين عملوا على المشروع في مؤتمر TED).الحقيقة هي أنه عندما يتلامس الصوت مع شيء ما ، فإنه يجعله يهتز. الحركات الناتجة عن هذه الاهتزازات طفيفة جدًا وغير مرئية بحيث لا يستطيع الشخص رؤيتها. ومع ذلك ، يمكن للكاميرا "رؤيتهم": لاستخراج الإشارة الصوتية من الفيديو ، استخدم العلماء تسجيل الفيديو بمعدل التقاط إطار أعلى من تردد الإشارة الصوتية.في البداية ، تم استخدام الكاميرات ذات تردد إطلاق 2000 و 6000 إطارًا في الثانية في التجارب ، لكن الباحثين حاولوا استخدام كاميرات أخرى ذات ميزانية أكبر. بالطبع ، لم يكن من الممكن استخراج الكلام الواضح من الفيديو المسجل بمعدل إطارات 60 إطارًا في الثانية ، ولكن لا يزال من الممكن فهم عدد الأشخاص الموجودين في الغرفة وجنسهم وحتى ميزات نطقهم.بالطبع ، عند التفكير في استخدام مثل هذه التطورات ، تتبادر إلى الذهن "قصص التجسس" ، ومع ذلك ، فإن الباحثين أنفسهم يصفون مشروعهم بالفرصة لاكتشاف جوانب جديدة في صورة الأشياء ودراسة خصائصها غير المكتشفة سابقًا. وإذا حاول الناس قبل مئات السنين التوصل إلى طريقة "لتسجيل الصوت" ، فإن هذا "التسجيل" أصبح الآن تأثيرًا جانبيًا ، وهو ما يساعد بدوره على الكشف عن خصائص جديدة لأشياء مألوفة.افعلها بنفسك
كما ذكرنا من قبل ، تم فك تشفير أول مخطط صوتي بفضل تقنية إعادة إنتاج الصوت من صور التسجيلات القديمة ( كتبنا بالفعل عن هذه التكنولوجيا في إحدى موادنا - يحتوي أيضًا على روابط لتسجيلات صوتية غير مشفرة). ومع ذلك ، يؤكد باتريك فيستر أنه يمكن لأي شخص التعامل مع هذه المهمة - إذا كان يعرف ماذا يفعل.يتم وصف عملية مفصلة في هذه المواد. بمفردنا ، نلاحظ أنه لحل المشكلة ، ستحتاج إلى صورة عالية الجودة ومهارات فوتوشوب أساسية (يجب أن تكون الموجة المرسومة على الفينيل رقمية ، "مستقيمة" - الأخدود الموجود على اللوحة ملتوي بشكل حلزوني - إزالة جميع أنواع الضوضاء والتشريد) ، بالإضافة إلى جهاز كمبيوتر قوي نسبيًا مع كمية كبيرة من ذاكرة الوصول العشوائي.من أجل تحويل الصورة الناتجة إلى ملف WAV ، يستخدم باتريك برنامجًا غريبًا نوعًا ما: هذا هو ImageToSound. إنه مجاني ، ولكن على الرغم من ذلك ، يصعب العثور عليه على الشبكة (شارك باتريك المصدر ).يقوم البرنامج على التوالي بتحويل كل كتلة صورة (عرض كتلة - 1 بكسل) إلى عينة صوتية. لسوء الحظ ، لا يدعم هذا البرنامج حتى Windows 7 (يستخدم المؤلف كمبيوتر منفصل يعمل بنظام Windows 98). كبديل ، يقترح فيستر استخدام برنامج AEO-Light ، لكنه يحذر من أنه ليس على دراية تامة بتعقيدات العمل معه.الخطوة الأخيرة هي التحكم في سرعة التشغيل. هنا تأتي الرياضيات البسيطة لإنقاذها. تحتاج أولاً إلى معرفة سرعة التشغيل على اللوحة الأصلية ، وطول ثورة واحدة للموجة الرقمية (بعد "إزالة الصبغة") بالبكسل وتردد أخذ العينات للملف النهائي.إذا تم تحرير الصورة في ملف صوتي بتردد أخذ العينات 44.1 كيلوهرتز ، فهذا يعني أن ثاني الملف الصوتي سيكون مساوياً 44100 بكسل للصورة. على سبيل المثال ، إذا كانت سرعة الأغنية على سجل فينيل 50 دورة في الدقيقة ، وبعد الرقمنة وإزالتها ، استغرقت ثورة واحدة من التسجيل 30.000 بكسل ، نحصل على 1500000 بكسل في الدقيقة (50 × 30.000).إذا قسمنا هذا الرقم على 60 ، نحصل على عدد وحدات البكسل في الثانية (1،500،000 / 60 = 25،000). اقسم معدل أخذ العينات على عدد وحدات البكسل في الثانية (44100/25000 = 1.764). اضرب الرقم الناتج في طول الملف الصوتي (وقت تشغيل الأغنية) واحصل على الوقت الذي تم فيه تسجيل هذا الملف في الأصل. إذا كانت سرعة تشغيل التسجيل الأصلي غير معروفة ، ينصح باتريك باختيار السرعة النهائية عن طريق الأذن.يحذر باتريك فيستر - هذا عمل شاق إلى حد ما يستغرق وقتًا وصبرًا ، ولكن في نفس الوقت يعطي نتائج مذهلة في بعض الأحيان: خاصة عندما يتعلق الأمر بأصوات الماضي ، التي يبدو أنها فقدت إلى الأبد.PS المزيد من المواد حول موضوع الصوت - في مدونتنا " عالم هاي فاي ".Source: https://habr.com/ru/post/ar393257/
All Articles