
التعبير عن الكلمات التي لا يمكن نقلها ؛ تشعر بأن المشاعر الأكثر تنوعا تتشابك في إعصار المشاعر. الابتعاد عن الأرض والسماء وحتى الكون نفسه ، في رحلة لا توجد فيها خرائط ، ولا طرق ، ولا علامات ؛ لابتكار قصة كاملة برمتها وإخبارها واستعادتها وستظل فريدة من نوعها ولا تقهر. كل هذا يتيح لك صنع الموسيقى - فن موجود منذ آلاف السنين ويسر آذاننا وقلوبنا.
ومع ذلك ، لا يمكن للموسيقى ، أو بالأحرى الأعمال الموسيقية ، أن تخدم ليس فقط من أجل المتعة الجمالية ، ولكن أيضًا لنقل المعلومات المشفرة فيها ، والمخصصة لأي جهاز وغير مرئية للمستمع. سنلتقي بكم اليوم دراسة غير عادية ، تمكن فيها طلاب الدراسات العليا من المدرسة السويسرية العليا التقنية في زيوريخ من إدراج بيانات معينة بشكل غير مدروس في الأعمال الموسيقية للأذن البشرية ، والتي أصبحت الموسيقى نفسها قناة لنقل البيانات. إلى أي مدى أدركوا تقنيتهم بالضبط ، هل تختلف الألحان مع البيانات المضمنة وبدونها ، وما هي الاختبارات العملية المبينة؟ نتعرف على هذا من تقرير الباحثين. دعنا نذهب.
أساس الدراسة
يسمي الباحثون تقنيتهم تقنية نقل البيانات الصوتية. عندما يقوم أحد المتحدثين بإعادة إنتاج لحن متغير ، فإن الشخص ينظر إليه كالمعتاد ، ولكن ، على سبيل المثال ، يمكن للهاتف الذكي قراءة المعلومات المشفرة بين الخطوط ، وبشكل أكثر دقة بين الملاحظات ، إذا جاز التعبير. الجانب الأكثر أهمية في تنفيذ هذه الطريقة لنقل البيانات ، العلماء (حقيقة أن هؤلاء الشباب لا يزالون طلاب الدراسات العليا لا يمنعهم من أن يكونوا علماء) استدعاء سرعة وموثوقية الإرسال مع الحفاظ على مستوى هذه المعلمات ، بغض النظر عن ملف الصوت المحدد. يساعد علم النفس الصوتي ، الذي يدرس الجوانب النفسية والفسيولوجية لتصور الإنسان للأصوات ، في التغلب على هذه المهمة.
يمكن أن يُطلق على جوهر إرسال البيانات الصوتية OFDM (تعدد إرسال تقسيم التردد المتعامد) ، والذي ، إلى جانب تكييف الموجات الحاملة الفرعية مع الموسيقى الأصلية بمرور الوقت ، جعل من الممكن تحقيق أقصى قدر من استخدام طيف التردد المرسل لنقل المعلومات. بفضل هذا ، كان من الممكن تحقيق سرعة نقل تبلغ 412 بت / ثانية على مسافة 24 مترًا (معدل الخطأ <10٪). أكدت التجارب العملية التي شملت 40 متطوعًا حقيقة أنه يكاد يكون من المستحيل سماع الفرق بين اللحن الأصلي والتاريخ الذي تم تضمين المعلومات فيه.
أين يمكن تطبيق هذه التكنولوجيا في الممارسة؟ للباحثين إجابة خاصة بهم: جميع الهواتف الذكية الحديثة وأجهزة الكمبيوتر المحمولة والأجهزة المحمولة الأخرى مجهزة بالميكروفونات ، وفي العديد من الأماكن العامة (المقاهي والمطاعم ومراكز التسوق وغيرها) يوجد مكبرات صوت مع موسيقى خلفية. على سبيل المثال ، يمكن تضمين بيانات الاتصال بشبكة Wi-Fi في لحن الخلفية هذا دون الحاجة إلى تنفيذ إجراءات إضافية.
أصبحت الميزات العامة لنقل البيانات الصوتية واضحة بالنسبة لنا ، والآن ننتقل إلى دراسة مفصلة لهيكل هذا النظام.
وصف النظام
يحدث دمج البيانات في اللحن بسبب إخفاء التردد. في الفواصل الزمنية ، يتم تحديد ترددات القناع ، وتُملأ الموجات الحاملة الفرعية OFDM القريبة من عناصر القناع بالبيانات.
الصورة رقم 1: قم بتحويل الملف المصدر إلى إشارة مركبة (لحن + بيانات) تنتقل عبر مكبرات الصوت.بادئ ذي بدء ، يتم تقسيم الإشارة الصوتية الأصلية إلى مقاطع متتالية للتحليل. يتم ضرب كل قطعة (H
i ) من L = 8820 عينة ، تساوي 200 مللي ثانية ، من خلال
نافذة * لتقليل الآثار الحدودية.
Window * هي وظيفة الوزن المستخدمة للتحكم في التأثيرات بسبب وجود الفصوص الجانبية في التقديرات الطيفية.
ثم ، تم العثور على الترددات السائدة للإشارة الأولية في المدى من 500 هرتز إلى 9.8 كيلو هرتز ، مما أتاح الحصول على ترددات الأقنعة f
M ، l لهذا الجزء. بالإضافة إلى ذلك ، تم إرسال البيانات في المدى الصغير من 9.8 إلى 10 كيلو هرتز لتحديد موقع الموجات الحاملة الفرعية في المستقبل. تم ضبط الحد الأعلى لنطاق التردد المستخدم على 10 كيلو هرتز بسبب انخفاض حساسية ميكروفون الهاتف الذكي عند الترددات العالية.
تم تحديد ترددات اخفاء بشكل فردي لكل قطعة تحليلها. باستخدام طريقة HPS (الطيف التوافقي للمنتجات) ، تم إنشاء ثلاثة ترددات سائدة ، وبعد ذلك تم تقريبها إلى أقرب ملاحظات النطاق اللوني التوافقي. هذه هي الطريقة التي تم بها الحصول على الملاحظات الرئيسية f
F ، i = 1 ... 3 ، التي تقع بين المفتاحين C0 (16.35 هرتز) و B0 (30.87 هرتز). استنادًا إلى حقيقة أن الملاحظات الرئيسية منخفضة جدًا لاستخدامها في نقل البيانات ، في حدود 500 هرتز ... 9.8 كيلو هرتز ، أوكتافاتها العليا 2
k f
F ، تم حسابها. كانت العديد من هذه الترددات (f
O ، l 1 ) أكثر وضوحًا نظرًا لطبيعة HPS.
الصورة رقم 2: أوكتافات محسوبة f O ، l 1 للملاحظات والتوافقيات الرئيسية f H ، l 2 لأقوى نغمة.تم استخدام مجمل الأوكتاف والتوافقيات كترددات أقنعة ، على أساسها تم الحصول على ترددات OFDM للحامل الفرعي f
SC ، k . أسفل وفوق كل تردد للإخفاء ، تم إدراج حاملين فرعيين.
بعد ذلك ، تم ترشيح طيف مقطع الصوت H
i عند ترددات الموجة الحاملة الفرعية f
SC ، k . بعد ذلك ، استنادًا إلى وحدات بت المعلومات في Bi ، تم إنشاء رمز OFDM ، بسببه يمكن إرسال المقطع المركب C
i عبر السماعة. يجب تحديد قيم ومراحل الموجات الحاملة الفرعية بحيث يمكن لجهاز الاستقبال استرداد البيانات المرسلة ، في حين لا يلاحظ المستمع حدوث تغييرات في اللحن.
شكل 3: رسم الطيف وتردد الموجات الحاملة الفرعية للجزء Hi من اللحن الأصلي.عندما يتم نسخ إشارة صوتية تحتوي على المعلومات المشفرة فيها من خلال مكبرات الصوت ، يسجلها ميكروفون جهاز الاستقبال. للعثور على مواضع البداية لرموز OFDM المدمجة ، يجب أولاً تخطي الإدخالات من خلال تصفية ممر الموجة. وبهذه الطريقة ، يتم استخراج نطاق التردد العلوي في حالة عدم وجود إشارة تداخل موسيقي بين الموجات الحاملة الفرعية. يمكنك العثور على بداية رموز OFDM باستخدام بادئة دورية.
بعد اكتشاف بداية رموز OFDM ، يحصل المستقبِل على معلومات حول الملاحظات الأكثر مهيمنة عن طريق فك تشفير مجال التردد العلوي. بالإضافة إلى ذلك ، فإن OFDM قوي بما فيه الكفاية ضد مصادر التداخل ضيق النطاق ، حيث إنه يؤثر فقط على بعض الموجات الحاملة الفرعية.
اختبارات عملية
كان مكبر صوت KRK Rokit 8 هو مصدر الألحان التي تم تغييرها ، كما لعب هاتف Nexus 5X الذكي الجانب المضيف.
شكل 4: الفرق بين المظاهر الحقيقية لـ OFDM وقمة الارتباط المقاسة في الداخل على مسافة 5 أمتار بين السماعة والميكروفون.تتراوح معظم نقاط OFDM من 0 إلى 25 مللي ثانية ، بحيث يمكنك العثور على بداية صالحة ضمن البادئة الدورية البالغة 66.6 مللي ثانية. يلاحظ الباحثون أن المتلقي (في هذه التجربة ، هاتف ذكي) يأخذ في الاعتبار أن رموز OFDM مستنسخة بشكل دوري ، مما يحسن من اكتشافها.
أول شيء يجب التحقق منه هو تأثير المسافة على معدل الخطأ في البتات (BER). للقيام بذلك ، تم إجراء ثلاثة اختبارات في أنواع مختلفة من الغرف: ممر به سجادة ، ومكتب به مشمع على الأرض ، وجمهور بأرضية خشبية.
تم اختيار أغنية "The The Cradle Will Rock" لفان هالين لتكون "موضوع الاختبار".تم ضبط مستوى الصوت بحيث يكون مستوى الصوت الذي يقاسه الهاتف الذكي على مسافة 2 متر من السماعة 63 ديسيبل.
الصورة رقم 5: مؤشرات BER اعتمادًا على المسافة بين السماعة والميكروفون (الخط الأزرق - الجمهور ، الممر الأخضر ، البرتقالي - المكتب).في الممر ، تم التقاط صوت 40 ديسيبل بواسطة الهاتف الذكي على مسافة تصل إلى 24 مترًا من السماعة. في الجمهور على مسافة 15 م ، كان الصوت 55 ديسيبل ، وفي المكتب على مسافة 8 أمتار ، وصل مستوى الصوت الذي يتصوره الهاتف الذكي إلى 57 ديسيبل.
نظرًا لحقيقة أن الجمهور والمكتب أكثر ترددًا ، فإن أصداء رمز OFDM المتأخرة تتجاوز طول البادئة الدورية وتزيد من BER.
تردد * - انخفاض تدريجي في كثافة الصوت بسبب انعكاسها المتعدد.
علاوة على ذلك ، أظهر الباحثون براعة نظامهم من خلال تطبيقه على 6 أغنيات مختلفة من ثلاثة أنواع (الجدول أدناه).
الجدول رقم 1: الأغاني المستخدمة في الاختبارات.أيضا ، من خلال البيانات الموجودة في الجدول ، يمكننا أن نرى معدل بت ومعدلات الخطأ بت لكل أغنية. تختلف سرعة نقل البيانات لأن BPSK التفاضلية (مفتاح إزاحة الطور) يعمل بشكل أفضل عند استخدام نفس الموجات الحاملة الفرعية. وهذا ممكن عندما تحتوي الأجزاء المجاورة على نفس عناصر التقنيع. توفر الأغاني الصاخبة بشكل مستمر أساسًا مثاليًا لإخفاء البيانات ، نظرًا لأن ترددات الاقناع أكثر وضوحًا في نطاق تردد واسع. يمكن للتغيير السريع للموسيقى إخفاء رموز OFDM جزئيًا فقط بسبب طول نافذة التحليل الثابتة.
بعد ذلك ، بدأ الناس في اختبار النظام ، والذين كان من المفترض أن يحددوا اللحن الأصلي والذي تم تعديله بواسطة المعلومات المضمنة فيه. لهذا الغرض ، تم نشر مقتطفات مدتها 12 ثانية من الأغاني من الجدول رقم 1 على موقع خاص.
في التجربة الأولى (E1) ، تم تزويد كل مشارك بجزء معدّل أو بجزء أصلي للاستماع ، وكان عليه أن يقرر ما إذا كانت هذه القطعة أصلية أم تغيرت. في التجربة الثانية (E2) ، يمكن للمشاركين الاستماع إلى كلا الخيارين عدة مرات كما يحلو لهم ، ثم يقرروا الخيار الأصلي والذي يتم تغييره.
الجدول رقم 2: نتائج التجارب E1 و E2.هناك مؤشران في نتائج التجربة الأولى: p ( | ) - النسبة المئوية للمشاركين الذين قاموا بتمييز اللحن الأصلي و p ( | ) - النسبة المئوية للمشاركين الذين حددوا النسخة التي تم تغييرها من اللحن على أنها أصلية.
من الغريب أن بعض المشاركين ، وفقًا للباحثين ، اعتبروا أن بعض الألحان المعدلة أكثر الأصلي من الأصلي. يشير متوسط مؤشر كلتا التجربتين إلى أن المستمع المتوسط لن يلاحظ الفرق بين اللحن العادي والآخر الذي تم تضمين البيانات فيه.
بطبيعة الحال ، سيكون بمقدور خبراء الموسيقى والموسيقيين اكتشاف بعض العناصر غير الدقيقة والعناصر المشبوهة في الألحان التي تم تغييرها ، ولكن هذه العناصر ليست مهمة لدرجة أنها تسبب عدم الراحة.
والآن يمكننا نحن أنفسنا المشاركة في التجربة. يوجد أدناه خياران لنفس اللحن - الأصلي والمعدّل. هل تسمع الفرق؟
النسخة الأصلية من اللحنمقابل
نسخة معدلة من اللحنللتعرف أكثر تفصيلاً على الفروق الدقيقة في الدراسة ، أوصي بأن تنظر في
تقرير المجموعة البحثية.
يمكنك أيضًا تنزيل أرشيف ZIP للملفات الصوتية للألحان الأصلية والمعدلة المستخدمة في الدراسة على
هذا الرابط .
خاتمة
في هذا العمل ، وصف طلاب الدراسات العليا في المدرسة التقنية العليا السويسرية في زيوريخ نظامًا رائعًا لنقل البيانات داخل الموسيقى. للقيام بذلك ، استخدموا إخفاء التردد ، والذي سمح بدمج البيانات في لحن لعبه المتكلم. يتم إدراك هذا اللحن بواسطة ميكروفون الجهاز ، الذي يتعرف على البيانات المخفية ويقوم بفك تشفيرها ، بينما لا يلاحظ المستمع العادي الفرق. في المستقبل ، يخطط الرجال لتطوير نظامهم ، واختيار طرق أكثر تقدمًا لتضمين البيانات في الصوت.
عندما يأتي شخص ما بشيء غير عادي ، والأهم من ذلك ، فإننا سعداء دائمًا. ولكن أكثر متعة هو أن هذا الاختراع تم إنشاؤه من قبل الشباب. العلم لا يوجد لديه قيود العمر. وإذا كان الشباب يعتبرون العلوم مملة ، فسيتم تقديمها في الزاوية الخطأ ، إذا جاز التعبير. بعد كل شيء ، كما نعلم ، العلم عالم مدهش لا يتوقف أبدا عن الدهشة.
الجمعة خارج القمة:
نظرًا لأننا نتحدث عن الموسيقى ، وبشكل أكثر تحديدًا عن موسيقى الروك ، فهذه هي رحلة رائعة عبر مساحات موسيقى الروك.
كوين ، راديو جا غا (1984).
شكرًا لك على اهتمامك ، ابقَ فضوليًا ، وتمتع الجميع بعيد نهاية الأسبوع ، أيها الرجال! :)
شكرا لك على البقاء معنا. هل تحب مقالاتنا؟ تريد أن ترى المزيد من المواد المثيرة للاهتمام؟ ادعمنا عن طريق تقديم طلب أو التوصية به لأصدقائك ،
خصم 30٪ لمستخدمي Habr على تناظرية فريدة من خوادم الدخول التي اخترعناها لك: الحقيقة الكاملة حول VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1 جيجابت في الثانية من 20 $ أو كيفية تقسيم الخادم؟ (تتوفر خيارات مع RAID1 و RAID10 ، ما يصل إلى 24 مركزًا وما يصل إلى 40 جيجابايت من ذاكرة DDR4).
ديل R730xd 2 مرات أرخص؟ فقط لدينا
2 من Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6 جيجا هرتز 14 جيجا بايت 64 جيجا بايت DDR4 4 × 960 جيجا بايت SSD 1 جيجابت في الثانية 100 TV من 199 دولار في هولندا! Dell R420 - 2x E5-2430 سعة 2 جيجا هرتز 6 جيجا بايت 128 جيجا بايت ذاكرة DDR3 2x960GB SSD بسرعة 1 جيجابت في الثانية 100 تيرابايت - من 99 دولارًا! اقرأ عن
كيفية بناء البنية التحتية فئة باستخدام خوادم V4 R730xd E5-2650d تكلف 9000 يورو عن بنس واحد؟