
يبدو أنه لن يكون هناك مشكلة كبيرة في المستقبل القريب إذا تحدث شخصان بلغات مختلفة. بالطبع ، تعد معرفة لغة إضافية ميزة كبيرة ، لكن يحدث أنك تحتاج إلى مناقشة مشكلة ملحة ، للعمل ، على سبيل المثال ، ولا يتحدث المحاور لغتك.
منذ حوالي أسبوع ، عرضت ممثلة الشركة ، جوليا وايت ،
التكنولوجيا الجديدة في المؤتمر . فهو لا يسمح فقط بتكوين صورة ثلاثية الأبعاد واقعية (في الواقع الافتراضي) ، ولكنه يتيح أيضًا معرفة الهولوغرام هذه بلغة معينة ، ويتم أخذ الدرجة اللونية والحجم والتوقيت وغيرها من المعلمات من الصورة المجسمة الأصلية. وهكذا ، يرى المحاور أمامه نسخة افتراضية من شخص آخر ، وهذه النسخة تتحدث اللغة المطلوبة.
أصبحت هذه التقنية ممكنة عن طريق مزج حلين مختلفين - الواقع المختلط والنص إلى كلام عصبي. يبدو أن التكنولوجيا ستوفر فرصة لإزالة حواجز الاتصال التي لا تزال قائمة. لقد مكن الإنترنت الناس من التواصل في الوقت الحقيقي ، والآن هناك فرصة للتحدث بنفس اللغة.
تم حل المهمة من قبل الشركة تدريجيا. المرحلة الأولى هي إنشاء صورة ثلاثية الأبعاد بيضاء واقعية في النمو الكامل. من أجل تحقيق هذا. زارت مختبر مايكروسوفت المتخصص حيث تم تسجيل العرض التقديمي باللغة الإنجليزية. كان التسجيل ضخمًا لإنشاء نموذج ثلاثي الأبعاد لشخص ما من عناصر التسجيل.
ونتيجة لذلك ، تم ذلك - بعد الانتهاء من المرحلة ، يمكن لأي حامل لنقاط الفيديو Microsoft HoloLens مشاهدة أدائها. حسنًا ، بعد ذلك ، بدأ العمل على نسخ صوت وايت وترجمة كلمتها إلى اليابانية باستخدام تقنية تحويل النص إلى كلام القائمة على الشبكات العصبية. كانت النتيجة ممتازة - تم نقل المعلمات الصوتية بشكل مثالي تقريبًا. بالطبع ، قدر الإمكان ، نظرًا لأن الخطاب الأخير كان باللغة اليابانية ، والذي يختلف صوته تمامًا عن أي لغة أخرى.
بطبيعة الحال ، هذه مجرد مظاهرة استغرقت وقتًا طويلاً للطهي. ولكن ، مثل أي تقنية ، بمرور الوقت ، تصبح أكثر كفاءة وسهولة في الاستخدام. تخطط شركة Microsoft Corporation لزيادة تحسين واستكمال مشروعها.
في البداية ، سيتم استهداف تطبيقه - على سبيل المثال ، مع انتشار النظارات ثلاثية الأبعاد ، ستصبح عروض الفنانين أو القادة السياسيين الأكثر شهرة. يمكن رؤيتها بجانبهم ، وسوف يتحدثون بلغتهم الأم للمشاهد.
يمكنك أيضًا تخيل المحاضرات التي نظمت بهذه الطريقة. علاوة على ذلك ، يمكن الافتراض بأمان أن تحويل الشخص إلى صورة ثلاثية الأبعاد تتحدث نفس لغة المشاهد سوف يستغرق عدة ساعات وليس أيام. الشيء الرئيسي هو المعدات اللازمة لتسجيل العروض ثلاثية الأبعاد والشبكة العصبية ، والتي هي قادرة على "ترجمة" خطاب المتحدث.