بكلمات بسيطة عن الصوت الرقمي والتناظري



التالي هو نسخة النص العاشر (05/22/2014) من البودكاست "الصوت". في ذلك ، يتحدث ديمتري كابانوف مع أناتولي ديمتريفيتش أرسينوف ، دكتوراه فيزيائي من خلال التدريب ، وخبير في مجال تكنولوجيا المعلومات والصوت الرقمي ، ومهندس في F-Lab حول موضوع الصوت الرقمي والتناظري.

[ الاستماع إلى هذه المسألة ]

[ المزيد عن البودكاست ]

مسائل بودكاست أخرى
  • [] [] ;
  • [] [] , ;

  • [] [] S-90;
  • [] [] ;
  • [] [] : , ;
  • [] [] «»;
  • [] [] ;

  • [] [] ;
  • [] [] ;
  • [] [] ;
  • [] [] ;
  • [] [] ;

  • [] [] ;
  • [] [] ;
  • [] [] : ;
  • [] [] : « » ;
  • [] [] ;

  • [] [] ;
  • [] [] ;
  • [] [] ;
  • [] [] - ;
  • [] [] .


دميتري كابانوف: نواصل التحدث مع خبراء ومهندسي أوديومانيا ، واليوم سنحاول التعمق ، ونلقي نظرة على طبيعة الصوت الرقمي والتناظري ، وربما نبدأ بسؤال ما هو الصوت من حيث المبدأ. ما هو الفهم الأساسي ، بكلمات بسيطة ، يختلف الصوت التناظري عن الصوت الرقمي أو التمثيل التناظري للصوت والتمثيل الرقمي للصوت؟

أناتولي أرسينوف:الإجابة على هذا السؤال ، أعتقد أنه من المناسب إحضار نماذج بسيطة مألوفة ، ربما [من] الدورة الدراسية ، إلى أي شخص متعلم روسي. على وجه الخصوص ، فإن تاريخ الصوت [ك] رقمي ، [هكذا] والتناظري يبدأ منذ فترة طويلة ، ومن الغريب ، حتى قبل ظهور الأجهزة الرقمية. يعلم الجميع إرسال صوت شخص باستخدام هاتف سلكي تقليدي. هذا [وهو] مثال حقيقي لإرسال الصوت التناظري من مسافة بعيدة. في هذه الحالة ، يوجد في مكبر الصوت جهاز استقبال هاتف أمامه ، حيث يوجد ميكروفون وغشاء يتأرجح وفقًا لصوت الشخص ، يحدث الإجراء المعاكس في الطرف المقابل ، أي أن غشاء الهاتف الموجود في أذن المشترك يتذبذب.

ما الذي ينتقل عن طريق الكابل؟ لدينا إشارة جهد تيار متردد: يتغير التيار في الكبل وفقًا لما يقوله الشخص ، إذا جاز التعبير ، حتى لا ندخل في التفاصيل. ما هو الصوت الرقمي؟ هنا [يمكننا أن نعطي مثالاً مماثلاً] من نفس الوقت - إرسال الإشارات التلغرافية ، شفرة مورس. في هذه الحالة ، أمام المذيع بعض النصوص أمامه ، ولكن يجب أن يعرف رمز مورس. علاوة على ذلك ، لمن يتم ترميز النص؟ من قبل الشخص الذي يعرف كيفية إرسال الحرف "أ" ، وكيفية نقل الحرف "ب" ، وما إلى ذلك. ما الذي يتم إرساله إلى خط الإشارة؟ يتم إرسال الإشارات: نقطة وشرطة ، الطريقة التي يتم بها ترميز الصوت تقريبًا الآن - مع الأصفار والأخرى ، تنقل دولتان حالتين.

ما الذي يجب على المشترك فعله على الجانب الآخر [إذا أراد] فهم هذا النص وقبوله واستلام هذه الرسالة؟ يجب أن يعرف رمز مورس ، يجب أن يتلقى هذه النقاط والشرطات ، ومعرفتها ، يفهم بالفعل ما هو على المحك. هذا هو ، في الواقع ، كل الفرق. في حالة واحدة ، يتم إرسال إشارة ، والتي تكون في طبيعة نموذج لصوت شخص تم إرساله بواسطة إشارات كهربائية ، في الحالة الثانية ، لدينا إرسال أحرف مشفرة بطريقة تعسفية. في هذه الحالة ، كانت هذه نقاطًا وشرطات. بعد سنوات عديدة ، في العصر الحديث ، لدينا بالفعل نوعان من نقل الإشارات ، وهما بعيدان جدًا عن هذا التاريخ القديم.

ديمتري:اتضح أن الصوت الرقمي أو التمثيل الرقمي للصوت يمكن فهمه على أنه نوع من التنازلات التي نحصل عليها من خلال أخذ صوت تناظري وتحويله إلى صوت رقمي.

اناتولي: حسنا ، هل هو حل وسط أم لا ... حل وسط مع ماذا؟ مع قدرات الأجهزة؟ نعم ، هذا حل وسط. علاوة على ذلك ، مع احتياجات التكنولوجيا الحديثة ، لنقل المزيد من المعلومات لكل وحدة زمنية إلى مسافات أطول بجودة عالية والقدرة على التصحيح اللاحق؟ نعم ، هذا حل وسط. بالطبع ، من أجل نقل الصوت التناظري لمسافات طويلة بجودة عالية ، يجب أن يكون للمعدات الطاقة المناسبة ، ولن أقول أنها ستكون رخيصة ، وستكون دائمًا مكثفة من الناحية المادية.

في مرحلة معينة من تطور التكنولوجيا ، اتضح أنها الأكثر إنتاجية لإرسال الإشارات ليس بشكل صريح ، كما هو الحال في المعدات التناظرية ، ولكن في شكل نموذج ، جدول أرقام ، هنا يمكنني تقديم مثال مماثل من ممارسة مختلفة قليلاً ، مألوفة أيضًا للجميع. إذن ، وجود خريطة جغرافية ... بهذه الطريقة يمكنك نقل المعلومات إلى صديقك إذا كانت المهمة هي الانتقال من نقطة إلى أخرى؟ تحتاج إلى أخذ بطاقة ، رسم خط بقلم رصاص ، كيف تمشي أو كيف ستذهب ، وإعادة توجيه هذه البطاقة ، ها أنت من فضلك - ننقل المعلومات في شكل صريح.

يمكنك القيام بذلك بطريقة أخرى - مع العلم أن الصديق لديه نفس الخريطة بالضبط ، تمرير لوحة مع إحداثيات النقاط. ما سيتم نقله في هذه الحالة؟ النشرة التي سيتم تسجيل الجدول عليها: خط العرض ، خط الطول ، خط العرض ، خط الطول ، خط العرض ، خط الطول ، إلخ. في هذه الحالة ، سيكون مجرد جدول أرقام. الرفيق ، بعد أن تلقى هذا الجدول ، وأخذ خريطته ووضع علامة على هذه النقاط بالإحداثيات ، سيحدد على الفور كيفية الذهاب. ماذا نقلنا في هذه الحالة؟ الخريطة نفسها مع المسار ، أم أننا مررنا الجدول ، نوعًا من الترميز؟

كل هذا يحدث في التكنولوجيا الرقمية. عنصر لا غنى عنه في التكنولوجيا الرقمية هو التشفير أو فك التشفير ، حسنًا ، اعتادوا على قول ذلك ، في التكنولوجيا الرقمية من المعتاد القول أن هذا تحويل من رقمي إلى تناظري.

ديمتري:يبدو لي مثالاً رائعًا ، هل يستحق الأمر ربط [موضوع] التخزين هنا؟ التنسيق ، فهم التنسيقات ، فهم اختلافها ، لأن هناك العديد من الأساطير حول التنسيقات التي نمتلكها - مع الخسائر ، دون خسائر ، ضغط ملف بطرق مختلفة ، إلخ.

Anatoly: كما يتبين من الأمثلة المذكورة أعلاه ، فإن الشكل الرقمي هو الشكل المشروط لإرسال الإشارة هو نظام إضفاء الطابع الرسمي ، من الناحية الرياضية. يتم إرسال الإشارة بالشكل التقليدي لنموذج رياضي - إذا تحدثنا بشكل أكثر عمقًا ، فهي مصفوفة تحتوي على أرقام معينة [تميز] الإشارة في كل لحظة من الزمن.

من حيث الصوت ، ماذا تنقل الأرقام؟ تنقل الأرقام طيف الإشارة وسعتها وحجمها. إن ترددات هذه الإشارة ، عالية ، منخفضة ، [ك] كيف أن هذه الترددات مترابطة زمنياً ، إلخ. هي خاصية طيفية يتم تحويلها إلى شكل رقمي ، يتم إرسالها [إلى الجهاز].

في فجر تكنولوجيا الكمبيوتر ، لم تكن قدرات أجهزة الكمبيوتر الشخصية واسعة للغاية. من أجل تحقيق المهام البسيطة ، كان من الضروري أن يكون لجهاز الكمبيوتر سعة ذاكرة كافية وأداء وحدة المعالجة المركزية. هذا لم يسمح للنموذج الرقمي بعرض الصوت المسجل بالتفصيل. مثال بسيط: إذا قمت بتوصيل بطاقة صوت بجهاز كمبيوتر قديم قبل خمسة عشر عامًا ، فقم بتوصيل ميكروفون ، ورقمنة صوتك ، ثم لا أعتقد أن [النتيجة] سيحبها الكثيرون ، [أي] جودة الصوت المسجل.

حسنًا ، بموضوعية ، لماذا؟ تم تطبيق إشارة ميكروفون على إدخال بطاقة الصوت. كانت خصائص التردد للمسار الرقمي متواضعة للغاية ، وبالتالي فإن تحويل الإشارة التناظرية ، أي الصوت إلى دائرة تسمح لك بعرض هذا الصوت رقميًا داخل أجهزة الكمبيوتر ... كانت عملية معقدة ، وبالطبع ، مصنعي الأجهزة ومطوريها في ذلك الوقت ، في محاولة لتوفير الذاكرة وأداء المعالج ، أنشأ مخططات بسيطة لترميز الصوت في الشكل الذي يمكن تخزينه فيه على جهاز الكمبيوتر.

إلى ماذا أدى هذا؟ للخسائر. كصوت فوق كل شيء. مع نمو إنتاجية أجهزة الكمبيوتر ، وأداء وحدة المعالجة المركزية ، وزيادة حجم الذاكرة ، بدأت هذه المشكلة في الإزالة تدريجياً من جدول الأعمال ، ولكن مع ذلك ، تركت النهج التي تم تشكيلها في ذلك الوقت بصماتها على تطوير التكنولوجيا الرقمية. في وقت ما ، إذا كانت ذاكرتي تخدمني بشكل صحيح ، كان [عام] 1994 ، [كان معهد Fraunhofer يعمل على إنشاء تنسيق MP3 - لا يزال هذا التنسيق شائعًا جدًا اليوم لتخزين الموسيقى والبيانات الصوتية المختلفة في المعدات المحمولة ، على وجه الخصوص ، الهواتف الذكية.

ديمتري:فيما يلي مرجع ويكي سريع: MP3 (بتعبير أدق ، MPEG-1/2 / 2.5 Layer 3 ؛ ولكن ليس MPEG3) هو برنامج ترميز من المستوى الثالث تم تطويره بواسطة فريق MPEG ، وهو تنسيق ملف مرخص لتخزين معلومات الصوت. تم تطوير MP3 من قبل مجموعة عمل من معهد Fraunhofer تحت إشراف Karlheinz Brandenburg من جامعة Erlangen-Nuremberg بالتعاون مع AT&T Bell Labs و Thomson.

كان أساس تطوير MP3 هو برنامج الترميز التجريبي لـ ASPEC (التشفير التكيفي الحسي الطيفي التكيفي). كان أول برنامج تشفير MP3 هو L3Enc ، الذي تم إصداره في صيف عام 1994. بعد عام واحد ، ظهر أول مشغل MP3 للبرنامج - Winplay3. عند تطوير الخوارزمية ، تم إجراء اختبارات على تركيبات شعبية محددة للغاية. كانت الأغنية الرئيسية هي Suzanne Vega's Tom's Diner. ومن هنا كانت النكتة القائلة بأن "MP3 تم إنشاؤها فقط لراحة الاستماع إلى أغنية براندنبورغ المفضلة" ، وبدأوا يطلقون على Vega اسم "أمي MP3".

اناتولي:ما الذي يتميز به؟ [ما] اختلافه عن الصوت ، الذي لا يختلف بأي حال من الأحوال عن التحويل إلى رقمي ، عن الإشارة التناظرية (التي كنا نسميها هذه الأشكال الموجية)؟ من على دراية بأجهزة كمبيوتر Apple ، هناك [مثل] هذه الملفات بتنسيق يسمى AIFF ، على ما أذكر.

ديمتري: نعم إنه كذلك.

Anatoly: شكل هذين الملفين ، تنسيق هذا الملف ، هو ببساطة عرض رقمي للصوت التناظري. ولكن في أجهزة الكمبيوتر في ذلك الوقت ، كانت تشغل حجمًا كبيرًا جدًا ويمكن تخزين هذه الملفات في الكمبيوتر قليلاً. ما الفرق بين ملفات MP3؟

قرر علماء الرياضيات في معهد فراونهوفر ، في التعامل مع هذه المشكلة ، تبسيط هذا النموذج الرياضي ، أي لإزالة النموذج الرقمي من الصوت الحقيقي الذي لن يدركه الشخص عند الاستماع. ما هي اللحظات التي تعرضت للمعالجة الرياضية قبل كل شيء؟ تم استخدام القوانين الأساسية للصوتيات. يقول أحدهم ، على وجه الخصوص: إذا بدا نوع من الإشارات ، حسنًا ، دعنا نقول ضرب الجرس أو شخص ما عازف على وتر على البيانو وفي نفس الوقت تم سماع نوع من الصوت الهادئ ، الفرق في حجمه [مع الصوت الأول ] يتجاوز 90 ديسيبل - الوحدة التي يتم قياس ضغط الصوت بها - لن يسمع هذا الصوت بأي شكل من الأشكال ، من قبل أي شخص لديه آذان معجزة.

ديمتري: لذلك ، يمكن التخلص من المعلومات.

اناتولي:لن يسمع أحد [هذا الصوت]. إذا كان الفرق بين الصوت الأعلى والأكثر هدوءًا في وقت معين أكثر من 90 ديسيبل ، فيمكنك إزالة هذه الأصوات من التسجيل بأمان وقطعها. هذه طريقة واحدة. ما يحدث هنا ، الخبراء [استدعاء] يخفون إشارة منخفضة المستوى بإشارة ذات مستوى أعلى.

طريقة أخرى: كقاعدة ، تسمح لك معدات Hi-Fi بالتقاط الإشارات بترددات معينة - إذا تحدثنا عن الترددات ولا نستخدم مفاهيم مثل الترددات العالية والمنخفضة والمتوسطة. الإشارات بترددات تتراوح من 20 هرتز إلى 20000 هرتز هي النطاق الذي يمكن للجهاز إنتاجه. هل يسمع الشخص هذا النطاق بأكمله؟ إذا نظرت من وجهة نظر إدراك الشخص وقدمت مصطلحًا مثل الصوتيات الصوتية ، فيمكنك [أيضًا] إجراء بعض التبسيط للإشارة.


, , . –

معظم البالغين - أولئك الذين تجاوزوا سن المراهقة ، كقاعدة عامة ، لا يسمعون ترددات فوق 16 كيلو هرتز ، مما يعني أنه يمكن أيضًا تقليل النطاق فوق 16 كيلو هرتز رياضيًا بطريقة ما ، وبالتالي إزالة هذه المعلومات من الملف الذي تم تسجيله باستخدام ميكروفون رقمي ، لأنه لن يراها المستمع بشكل ملائم. يحدث الشيء نفسه في النطاق المنخفض: أولئك الذين يشاركون في علم وظائف الأعضاء البشرية يعرفون أن أي شخص ، إذا كان طبيعيًا ، بالطبع ، وليس لديه أمراض ، لا يرى إشارات منخفضة التردد أقل من 16 هرتز مع أذنه - إنه يدرك [مثل إشارات] إما عن طريق اللمس أو أعضاء الجسم.

تبدأ ، يمكن أيضًا حذف جميع هذه الأصوات دون ألم بدون فقدان الجودة الرئيسية لإشارة الصوت ، إذا كانت ، على سبيل المثال ، قطعة موسيقية. من حيث المبدأ ، يوجد اليوم الكثير من هذه الطرق: الدوائر المستخدمة في الصوت الرقمي ، وتنسيقات MP3 ، وإخفاء النغمات النقية بالضوضاء ، وما إلى ذلك ، إلخ.

لتوضيح بإيجاز ما هو: بعد إجراءات تحويل نموذج رقمي للصوت التناظري ، الذي نراه في تنسيقات الموجة أو AIFF ، إلى تنسيق MP3 ، بعد تنفيذ هذه الإجراءات (إخفاء ، حذف تلك الأصوات التي لا يمكن يراها الشخص) - الصوت في المرحلة المتوسطة ليس مريحًا جدًا للاستماع إليه ، فهو يحمل بصمة التوقف ، وقد يكون سماع الشخص ، وخاصة الموسيقي ، غير مريح ، وبالتالي ، لإخفاء العيوب في المرحلة الأخيرة ، "يختلط" في الأشكال الرقمية "إشارة مستوى ضوضاء منخفضة السعة.

يتم ذلك عن طريق خوارزمية خاصة. من حيث المبدأ ، يمكنك توضيح ذلك بهذا المثال: إذا كنت في غرفة ما وفي الغرفة المجاورة يتحدث شخص ما ، ويزعجك ، قم بتشغيل المكنسة الكهربائية. ضجيج المكنسة الكهربائية هو إشارة تردد أقل بالنسبة إلى الكلام البشري ، وإشارات التردد المنخفض دائمًا ما تحجب إشارات التردد العالي ، ولكن ليس العكس. سوف تتوقف عن سماع المحاورين المزعجين. يحدث الشيء نفسه تقريبًا في الأشكال الرقمية ، في المرحلة الأخيرة بعد الرقمنة ، إشارة ضوضاء بسعة معينة ، يتم خلط تركيبة طيفية معينة ، يمكن أن يكون نوعًا من الضوضاء البيضاء.

ديمتري:حسنًا ، دعنا نحاول التحدث عن الحالات التي يمكننا فيها القول أننا ما زلنا نفقد شيئًا باستخدام MP3 - فهو ليس دائمًا مثاليًا للاستخدام ، وهو ليس مناسبًا دائمًا ، ويمكن لبعض فئات المعدات أن تسمح لنا بشيء أكثر.

أناتولي: تمامًا ، MP3 ، كتنسيق للتخزين المضغوط للبيانات الصوتية في تكنولوجيا الكمبيوتر وكواحد من أقدم التنسيقات ، بدأ ببطء ، بمرور الوقت ، يفقد شعبيته. لماذا ا؟ حسنًا [قبل كل شيء] ، زادت تقنية الكمبيوتر من أدائها وذاكرتها ، [مما يعني] أن الحاجة إلى الضغط ، وإيقاف البيانات الصوتية قد اختفت ، ولا يوجد مثل هذا التوتر - لدينا الآن ذاكرة كافية على أجهزة الكمبيوتر الحديثة ، وأداء المعالج يكفي ، لذلك نحن يمكننا الاستماع إلى صوت رقمي غير مضغوط.

ما الخطوات التي تم اتخاذها في ذلك الوقت للتهرب من إصابات الموسيقى المدمجة؟ بادئ ذي بدء ، ظهرت تنسيقات منافسة لتخزين الصوت المضغوط. أولئك الذين يستخدمون أجهزة كمبيوتر Apple والأجهزة اللوحية والهواتف الذكية وأجهزة iPhone ، يعرفون الشكل الذي يتم بيع الموسيقى به في متجر Apple [iTunes] - إذا لم أكن مخطئًا ، فهو MP4 ، أليس كذلك؟

ديمتري: نعم.

Anatoly: سيقول شخص ما أنه أيضًا صوت رقمي ومضغوط أيضًا ولديه عيوب أيضًا. نعم. فقط ظهر في وقت لاحق من MP3 ، بدأ العمل على هذا التنسيق في وقت ما في عام 1997 ، أي بعد 3-4 سنوات تقريبًا [إنشاء] MP3 ، مما يعني أن المطورين الذين طوروا نظام ترميز الصوت المضغوط هذا أخذوا في الاعتبار المشاكل وحسنت العيوب التي كانت بالتنسيقات السابقة [المنتج].

إلى ما أحمله هذه الأمثلة: الصوت الرقمي ، بعد ظهوره في مرحلة معينة ، مر بتطور معين مع ظهور أجهزة الكمبيوتر ، وتطورت تنسيقات كل من التخزين غير المضغوط للبيانات الصوتية وتنسيقات [تخزين] الصوت المضغوط. الطريقة الحديثة لترميز الصوت بتنسيق MP3 أو ما شابه متقدمة جدًا.

بعد أن اكتسبت شعبية في مرحلة معينة ، أصبح الآن [تنسيق] مثبتًا بالفعل على مجموعة معينة من الأجهزة: في المقام الأول على تكنولوجيا الاتصالات المحمولة المحمولة - الهواتف الذكية ، والهواتف ، واللاعبين ، وما إلى ذلك. ، امتزج عضويا في هذا الهيكل. إذا تحدثنا عن معدات جادة ، للاستماع إلى المنزل ، على وجه الخصوص ، معدات Hi-Fi ، فبالتأكيد هنا ، لن يوافق كل مستمع مميز على أن التنسيقات الرقمية لتخزين البيانات الصوتية في شكل مضغوط مناسبة.


بالنسبة لأولئك الذين لا يقبلون التنسيقات الرقمية لتخزين البيانات في شكل مضغوط ، فإن Audio Mania لديها حلول تناظرية. في الصورة - جزء من التثبيت من Audiomania

موادنا ذات الصلة:


ربما يكون من المناسب مواصلة حديثنا مع خصائص الواجهة الصوتية لجهاز كمبيوتر حديث ، وهو أساس الصوت الرقمي الحديث. علاوة على ذلك ، خلال المحادثة ، سيتضح كيف يرتبط هذا بموضوع محادثتنا ، إلى المعدات الصوتية المتطورة ، على سبيل المثال. لذا ، فإن بطاقة الصوت الحديثة للكمبيوتر الشخصي أو الكمبيوتر المحمول لها العديد من الخصائص التي تصف تمامًا قدرات هذا الكمبيوتر من حيث تخزين أو إعادة إنتاج الصوت الرقمي. ما اعني؟ الترددات التي تعمل بها بطاقة الصوت وعمق البت لهذه البطاقة الصوتية. ربما يكون المستخدم على دراية بأرقام مثل 16 بت و 44 كيلو هرتز.

ديمتري: بالطبع.

اناتولي:هذه هي الخصائص الأساسية لأي قسم صوتي في الكمبيوتر الحديث ، سواء كان سطح المكتب أو محمولًا. تم العثور على نفس الخصائص (أي عمق البت للمعالجات) على مشغلات الأقراص المضغوطة القياسية. دون الخوض في التفاصيل ، يجب أن يقال أن هذا المعيار ظهر منذ فترة طويلة. تم تطوير معيار لتخزين البيانات الصوتية من هذا النوع (16 بت و 44 كيلو هرتز) من قبل الشركات المصنعة للأجهزة الصوتية المنزلية ، والتي تحظى بشعبية كبيرة معنا جميعًا - Phillips و Sony و Toshiba. مع تطور تكنولوجيا الكمبيوتر ، اكتسبت بطاقات الصوت إمكانات إضافية ، على وجه الخصوص ، زاد عدد الترددات التي يمكن أن تعمل بها بطاقة الصوت - 48 كيلو هرتز ، 96 كيلو هرتز ، 192 كيلو هرتز ، كما زاد بت المعالج المثبت على بطاقة الصوت - 16 بت ، 24 بت ...

ديمتري : 32 ...

اناتولي:والآن 32. عند التحدث بلغة احترافية ، فإن التردد 44 كيلوهرتز هو هذا التردد الضروري ، والذي يسمح لك بحفظ شكل موجة الإشارة الصوتية ، على سبيل المثال ، قطعة موسيقية أو صوت شخص. من أين أتى هذا الرقم ولماذا تعمل بطاقة الصوت على هذا التردد؟ كان هناك عالم رياضيات مثل كوتلنيكوف أثبت ، من خلال نظريته ، هذه الحدود للأداة التقنية ، والتي تسمح برقمنة إشارة بجودة عالية بما فيه الكفاية.

من المناسب إعطاء مثال: أبسط صوت ، على سبيل المثال ، صوت الأنبوب وأنبوب الأطفال ... شكل إشارة الصوت الخاصة به يشبه الموجة الجيبية ، دعنا نقول ذلك. ما هو 44 كيلو هرتز؟ هذا هو تردد بطاقة الصوت. سيتم قطع هذه الإشارة ، مرة واحدة في بطاقة صوت ، على الفور إلى 44 ألف شرائط رأسية. ما الذي نحصل عليه نتيجة هذا الخفض؟ نحصل على قيمة حجم الإشارة في كل نقطة زمنية - واحد وأربعين ألف جزء من الثانية.

ديمتري: والآن نحتاج إلى تشفير كل هذه الشرائط.

اناتولي:الآن نحن بحاجة إلى تشفير هذه الشرائط وحفظها على الكمبيوتر. كيف يمكننا تشفيرها؟ يمكنك تذكر قيمة الصوت في كل شريط. حسنًا ، هناك خاصية أخرى لبطاقة الصوت تلعب دورها - عمق البت. على وجه الخصوص ، 16 بت. ما هو 16 بت؟ يقول علماء الكمبيوتر هذا: اثنان إلى الدرجة السادسة عشرة.

ديمتري: هكذا.

اناتولي:ما هو الرقم 65 الف فلسا؟ اتضح أنه يمكنني استخدام رقم من صفر إلى 65536 ، على وجه الدقة ، للتعبير عن ارتفاع هذا الشريط نفسه. سيكون هناك عدد. في حالة واحدة ، سيكون 60 ألفًا ، وفي الحالة الأخرى - 30 ألفًا ، إلخ. [يعني] ، في هذه الحالة سنحصل على جدول للمرة الثانية ، سيحتوي على 44 ألف رقم ، سيتم التعبير عن كل منها برقم من صفر إلى 65 536. سيكون هذا الجدول ملف صوتي غير مضغوط.

ديمتري: الآن نعمل مع هذا الجدول أكثر ...

Anatoly:ما الذي نراه هنا؟ ماذا لو كانت سرعة بطاقة الصوت أعلى ، [إذن] ، على الأرجح ، سنحصل على عدد أكبر بكثير من هذه الأرقام ، والتي من شأنها وصف إشارتنا بشكل أكثر دقة. بطبيعة الحال ، فإن رغبة المطورين والمصنعين هي الاقتراب من الشكل الموجي الحقيقي. هذا هو المكان الذي تأتي منه رغبة المصممين الهندسيين في زيادة الترددات. عامًا بعد عام ، إذا جاز التعبير ، من فئة أجهزة إلى أخرى ، وما إلى ذلك.

وقد أدى هذا التطور إلى حقيقة أن هذه الترددات ازدادت ببطء بدءًا من 44 كيلو هرتز. لقد استخدمت الكلمة المؤسفة "بهدوء" ، لأنه في الواقع كان التطور أكثر تعقيدًا بكثير ، حيث تم استخدام جميع الترددات: 32 كيلوهرتز و 24 كيلوهرتز. قد يسأل المستمع أو شخص فضولي: "أين يتم استخدام هذه الترددات؟" لأنه من الواضح أن الصوت [عند استخدام الترددات أقل من 44 كيلوهرتز] سيكون أكثر صرامة. على سبيل المثال ، عند إرسال الإشارات التلفزيونية في تكنولوجيا الهاتف. ليست هناك حاجة لوصف الإشارة بدقة شديدة ، ولكن عند إرسال إشارة موسيقية معقدة ، بعض أجزاء الحفلة الموسيقية ، كما اتضح ، لا تفي 44 كيلوهرتز بمتطلبات الاستماع الدقيق. لذلك ، زادت خصائص التردد للبطاقات بشكل ثابت من جيل إلى جيل.

لإنهاء المحادثة حول هذا الموضوع وعدم الخوض في التفاصيل ، ربما يجب عليك إعطاء مثال - ولادة الصوت عالي الدقة ، كان عام 2004 ، طورت Intel هذا العام فقط مواصفات الصوت عالي الدقة ، والتي هي في القيمتين التاليتين: 32 بت و 192 كيلو هرتز. لذا ، بعد تطوير مواصفات الصوت عالي الدقة ... ما هو HD ، كيف يمكننا فك تشفيره؟

ديمتري: عالي الوضوح. دقة عالية.

اناتولي:دقة عالية ، أي صوت عالي الدقة. قد يكون هذا المعيار بالفعل هو الأساس لمعدات صوتية عالية الجودة للغاية ، لمصادر الإشارة التي ، على سبيل المثال ، ستنافس ، ولن أخاف من هذه الكلمة ، مع الفينيل. كيف انتهى تاريخ تطوير الصوت عالي الدقة؟ قامت Intel بتحويل تطويرها إلى ثلاث شركات تصنيع للواجهة ، ثم ، على أساس هذه الواجهات ، الشركات التي تنتج برامج ترميز صوتية لأجهزة تقنية محددة ، بدءًا من Realtek وتنتهي مع Wolfson ، طورت برامج ترميز ، لكل منها معالجاتها الرقمية.

Source: https://habr.com/ru/post/ar383321/


All Articles