في
SXSW قدم مساعد افتراضي صوته في الصوت لا يشبه الإناث أو الذكور. نقول كيف تم إنشاؤه وننظر إلى الآفاق.
الصورة غاريث هافاكري / CC BY-SAلماذا هناك حاجة إلى صوت "محايد بين الجنسين"
وفقًا للدراسات ، يفتقر مستخدمو السماعات الذكية والمساعدين الصوتيين إلى إصدار "محايد" من الصوت دون ميزات واضحة للإناث أو الذكور. في استطلاع Space10 R&D ، يفضل ما يقرب من نصف المستجيبين البالغ عددهم 12000 أن يسمعوا صوت "اللاجنسي" لمساعد. في هذا التصميم ، يربط الناس بينه وبين أنظمة الذكاء الاصطناعي المخفية "تحت غطاء" المساعد. الصوت المحايد أكثر ملاءمة لصورة "السيارة". ومع ذلك ، فإن اللاعبين الكبار في هذا السوق ليس لديهم مثل هذا الخيار.
اقترح خبراء الفضيلة حلهم - في مؤتمر SXSW في أوستن ، قاموا بتقديم مساعد صوت "غير جنسي" جديد يدعى Q. تم
تطويره بالاشتراك مع منظمة Equal AI غير الربحية ، و thirtysoundsgood و Koalition Interactive ، بالإضافة إلى خبراء اللغويات.
كيف يعمل مساعد Q وكيف تم إنشاؤه
لإنشاء مساعد جديد ، تم دمج أصوات خمسة أشخاص في واحد. تم إعطاء "الصوت" الأخير للاستماع إلى المستخدمين المحتملين لمساعد من مختلف دول أوروبا - كان على الناس أن يقيموا على نطاق من خمس نقاط كم كان يبدو أنه امرأة. وفقًا لنتائج الاختبار ، تم تصحيح الصوت - جعله أقل أو أعلى - ثم سمح مرة أخرى بالاستماع إلى المستخدمين.
أدى العمل التكراري مع مجموعة تركيز مكونة من أربعة آلاف ونصف المستطلعين إلى تأليف مؤلفي المشروع إلى أداء صوتي "محايد".
وفقًا للمطورين ، يبدو صوت Q للناس "بدون جنس" ، لأن صوت المساعد يكمن في مدى التردد بين أصوات الذكور والإناث. بالنسبة إلى الأول ، يبلغ طيف الترددات 80-180 هرتز ، وللأخير ، يتراوح بين 140-255 هرتز. يقع Voice Q في النطاق المحايد الذي يتراوح بين 145 و 175 هرتز ، والذي لا يسمح بتحديد نوع الجنس بشكل فريد.
يمكنك الاستماع إلى كيف يبدو المساعد في الفيديو على هذا
الرابط ، وكذلك على
موقع المشروع.
الآراء والإمكانات
يستجيب الصحفيون إيجابيا لمشروع Q. وفقًا لكاتب العمود في CNBC ، يبدو المساعد "واثقًا" تمامًا ، ولكن في الوقت نفسه يبدو ودودًا وسريع الاستجابة. تحدث مؤلفو المشروع عن احتمالات المساعد. إنهم يؤمنون بنجاح الفكرة ، لأن Q
توسع إمكانيات الاختيار لمستخدمي السماعات الذكية والمساعدين الصوتيين.
لا يخطط المطورون لإطلاق جهازهم أو تطبيقهم ، لكنهم يريدون جذب انتباه شركات تكنولوجيا المعلومات وتقديمهم لإضافة صوت محايد لمساعديهم. يخطط منشئو Q لإخبار شركات النقل والدولة والمؤسسات الأخرى التي تستخدم إعلانات صوتية عن منتجاتها.
ومع ذلك ، فإن مستقبل المشروع لا يزال غير واضح. لم تعلن أي شركة تكنولوجية بعد عن رغبتها في العمل مع المبدعين في كيو ، وربما بعد الضجيج في وسائل الإعلام التكنولوجية ، سيتم تطوير مساعد "محايد جنسانيا" من قبل عمالقة تكنولوجيا المعلومات بشكل مستقل.
من يقوم بتطوير مساعدين جنسيين
في مجال المساعدين الصوتيين ، لا توجد نظائر Q حتى الآن. ومع ذلك ، فإن القدرة على اختيار "نوع الجنس" للتصويت موجودة بالفعل في جميع المشاريع البارزة في هذا المجال. بالنسبة إلى المستخدمين الناطقين باللغة الإنجليزية في مساعد Google
، تتوفر عشرة أصوات مختلفة من الذكور والإناث ، وفي سيري ، صوت من الذكور والإناث لهجات مختلفة. يمكنك تغيير الصوت في Amazon Alexa - تتوفر أصوات مختلفة في "مهارات" السماعة الذكية.
Photo Tony Webster / CC BY-SAيمكن العثور على نظائر Q في منطقة chatbot. تم تطوير واحدة من أول روبوتات "محايدة جنسانيا" في شركة Sage البريطانية - كانت تسمى Pegg. وفقًا لمدير المشروع كريتي شارما ، فقد أصبح المساعد غير جنسي لإنشاء هوية بوت له ، وليس
بوتًا يتظاهر بأنه إنسان .
يتم تطوير برامج الدردشة المحايدة أيضًا
من أجل سلسلة متاجر GoDaddy و Lowe - سيتم استخدام كلا الروبوتين في مجال خدمة العملاء.
النتائج
على الرغم من أن المبدعين من السماعات الذكية والمساعدين يوسعون نطاق الأصوات المتاحة ، إلا أن الصوت "الافتراضي" للمساعد لم يتغير. وفقًا
لـ Slate ، قد يكون هذا الثبات متعلقًا بالاعتراف بالعلامة التجارية - إذا تغير صوت المساعد بشكل كبير ، فسيؤدي ذلك إلى رد فعل سلبي للمستخدمين الذين اعتادوا على التمييز بين الخدمات المختلفة عن طريق الأذن.
على الأرجح ، لن تصبح الأصوات "المحايدة" هي المعيار المقبول عمومًا في سوق المساعدين الصوتيين الكبار. ومع ذلك ، فإن شعبية مثل هذه الحلول بين المستخدمين يمكن أن تؤدي إلى ظهور لاعبين جدد يمكنهم تقديم مجموعة واسعة من الصور للمساعدين الظاهري.
قراءة إضافية - حول الصوت والموسيقى من مدونتنا وقناة Telegram:
كما تقول الأشجار والنباتات الأخرى
كيفية تحويل الرسومات إلى صوت ، ولماذا تحتاجها
تسجيل وتحرير بودكاستأ.
ما هي ميزات ومهام مرافقة الصوت للألعاب