افهمني اذا استطعت



في الأسبوع الماضي ، تلقينا رسالة من مرشح لم ينجح في مقابلة باللغة الإنجليزية. اتضح أن زملائنا أصبحوا مشاركين في تجربة تقنية تمت بالتوازي مع المقابلة. نحن نقدم رسالة مع الحد الأدنى من التغييرات ونشكر المؤلف على فكرة شجاعة مثيرة للاهتمام في تنفيذها.

"أعتقد أنني لست مناسبًا لك ، لأنني فشلت في اختبار اللغة الإنجليزية للأسف. نعم ، ليس لدي ممارسة جيدة للغة الإنجليزية المنطوقة ، ولكن هذا لا يزعجني من قراءة أوراق البيانات والتواصل مع الدعم الأجنبي عن طريق البريد. في الواقع الآن لا يتعلق الأمر بذلك ، مع العلم مسبقًا أنني لن أجتاز اختبار إجادة اللغة ، لا يسعني إلا أن أغتنم الفرصة لأخذ نهج تقني لهذه المشكلة. على الرغم من أنني لم تتح لي الفرصة لاختبار طريقي مباشرة مسبقًا ، خاصة في التعامل مع شخص يجيد اللغة الإنجليزية ويعرف ميزات النطق ، فقد قررت تجربته.

يجب أن أعتذر عن التجربة للموظف الذي أجرى الاختبار ، ولجودة الصوت غير الجيدة المرتبطة بالسمات التقنية لمجمع "my".

للتعويض عن المشاركة في التجربة ، سأقول فكرته. على الرغم من أنها ليست جديدة ، إلا أنني أعتقد أنها ستكون مثيرة للاهتمام للمتخصصين التقنيين ، ومع المستوى المناسب من التدريب ونهج الفريق ، يمكن استخدامه للحصول على نتيجة مثيرة للاهتمام وحتى منتج تجاري.

سأصف الجوهر: لقد استخدمت جهازي كمبيوتر متصلين بالإنترنت ، وترجمة Google مع التعرف على الكلام ومزج. للقيام بذلك ، قمت بتوصيل المسار التناظري لهاتفي المحمول ببطاقات الصوت لوحدتي نظام.

تم تكوين وحدة نظام واحدة للترجمة من الإنجليزية إلى الروسية ، على التوالي ، تم توصيل إخراج الصوت للهاتف بإدخال خط بطاقة الصوت. في إعدادات بطاقة الصوت ، تم تعيين وضع تكرار الإشارة من إدخال الخط إلى إخراج سماعة الرأس لسماعة الرأس ، لذلك سمعت الكلام الأصلي ورأيت صحة التعرف على الكلام من ترجمة Google.

تم تكوين وحدة النظام الثانية للترجمة من الروسية إلى الإنجليزية ، وتم توصيل إدخال الميكروفون الخاص بها بميكروفون سماعة الرأس الذي كان علي. لقد قمت بتوصيل خرج الصوت لوحدة النظام بالمسار التناظري للهاتف.

وهكذا ، رأيت النص الإنجليزي واستمعت إلى النص الأصلي ، ورأيت الترجمة ، وعندما قلت الإجابة على الكمبيوتر الثاني ، قمت بتجميعها في الكلام. نظرًا لأن Google تتحدث بصوت أنثوي ، استخدمت مرشحات Fruity Loops الرقمية لمنحها نغمة منخفضة ذكورية وأرسلت صوتًا معالجًا بالفعل إلى المسار التناظري للهاتف.

على الرغم من أنني فشلت في اختبار اللغة الإنجليزية ، لم يكن السبب في الاعتراف الخاطئ. لقد خذلني العنق الضيق للنظام ، وهو اتصال إنترنت الجيل الثالث 3G - للأسف ، ليس لدي خط سرعة آخر. في الصباح ، كما أفهمها ، كانت المحطة الأساسية أقل تحميلًا وكان لدي عرض نطاق ترددي كافٍ. ولكن بعد الغداء ، غرقت الشبكة في أكثر الأوقات غير المناسبة.

كانت نتيجة التجربة أنني تمكنت من الصمود في الجمل القليلة الأولى ، ثم توقفت سرعة تركيب الكلام لتكون كافية ، وتحولت إلى إجابات مستقلة وفشلت. على الرغم من أنني رأيت الترجمة الصحيحة ، إلا أنني غير قادر على بناء الجمل بسرعة. من المضحك أن المحاور لم يلاحظ التحول من الروبوت إلى شخص ، حيث يسلط الضوء فقط على إغلاق مولد الضوضاء المريح ، لأنه في فترات التوقف ، اعتقد محاوري أن الاتصال فقد بشدة.

يحتاج النظام إلى تحسين - لمعالجة الإشارة المسبقة من الميكروفون مسبقًا ، وقطع الضوضاء التي لا تعطي تأثير الصمت ، وهو أمر مهم بالنسبة لـ Google. ثم سيتمكن من مقاطعة المعالجة وتخصيص مكون صوتي ، مما سيقلل حركة المرور الصادرة ، ويزيد من سرعة الاتصال ولن يفقد حزم UDP. في هذه الحالة ، يكون النظام قتاليًا تمامًا. ننقل هذا إلى اثنين من Raspberry PI ونحصل على مترجم في الوقت الحقيقي.

أنا شخصياً لا أستطيع أن أدرك هذه الفكرة - أحتاج إلى DSP للمعالجة المسبقة ، أحتاج إلى القيام بدوائر ، تولد طوبولوجيا لوحة الدوائر ، كتابة خوارزمية معالجة لـ DSP (على الرغم من أنها في المجال العام) ، ثم كتابة برنامج لـ Raspberry PI مع وظائف ملائمة وتفاعل مناسب مع API جوجل هذه المهمة في نطاق سلطتي ، ولكنها أكثر ملاءمة لفريق التطوير. لا يزال ، لديها الكثير من المهام الفرعية.

أعتقد أن الفكرة مثيرة للاهتمام وستجد مشترًا ، سيكون من السهل إدراك الشركة ، ولن أقوم بتجميع الغبار على رفوف حماسها الخاص.

شكرا لك على النظر في ترشيحي! "

Source: https://habr.com/ru/post/ar398561/


All Articles