الاتصال بالفيديو من العين إلى العين: محاولات لحل مشكلة عدم الاتصال بالعين


تحتوي أجهزة الكمبيوتر والهواتف الذكية والأجهزة اللوحية الخاصة بنا على كاميرات فيديو مدمجة تستهدف المستخدمين. أصبحت الدردشة المرئية ومؤتمرات الفيديو - واحد على واحد ، واحد مع الكثير ، والكثير مع الكثير - شائعة سواء في قطاع الأعمال أو بين الناس العاديين ، وأعتقد أن معظمنا سيوافق على أن هذا الاتصال أفضل بكثير من المحادثة العادية باستخدام الصوت فقط . مراقبة وجه شخص آخر يثري المحادثة ويزيد الرضا عنها. ومع ذلك ، أزعجتني ميزة واحدة تتعلق باتصال الفيديو الحالي: عدم قدرة المشاركين في المحادثة على النظر إلى أعين بعضهم البعض. لم تكن هناك مشكلة من هذا القبيل في ستار تريك ، وهذا الكون ، بالطبع ، هو مصدر كل توقعاتي التكنولوجية.

أنظر إلي أثناء التحدث


إذا كنت تستخدم دردشة الفيديو ، فربما تفهم ما أقصده. توجد الكاميرا التي تظهر في وجهك أعلى (وأحيانًا أسفل أو إلى الجانب) من شاشتك. هذا يعني أن الزاوية التي تنظر فيها إلى الشاشة تختلف عن الزاوية التي تراها الكاميرا (والمحاور الخاص بك) - ويعرف هذا التأثير باسم المنظر [أو لا ؛ بالنسبة إلى المنظر هو تغيير في الموضع الظاهر لكائن بالنسبة لخلفية بعيدة ، اعتمادًا على موضع المراقب / التقريب. العابرة.]. سيكون لدى المحاور انطباع بأنك تنظر إليه في العين فقط إذا نظرت إلى الكاميرا. لذلك ، عندما ترى صورة صديقك على الشاشة ، يبدو له أنه ينظر إلى الأسفل (أو في اتجاه مختلف ، ولكن ليس في اتجاهك) ، وأنت تبدو تمامًا على شاشة صديقك. بالطبع ، يمكنك وضع الكاميرا مباشرة أمام الشاشة ، ولكن بعد ذلك ستغلق الكاميرا صورة المحاور الخاص بك.

يعد الاتصال بالعين مهمًا للغاية لإجراء محادثة ذات معنى ، وفي النهاية ، فإن الهدف من استخدام الفيديو بدلاً من الصوت هو رؤية الشخص الذي تتحدث إليه. ولكن إذا لم تتمكن من النظر إلى عيون الشخص ، فإن هذا يلغي معظم فوائد الفيديو عبر المكالمات الهاتفية العادية. عادةً ما تشير إرشادات التواصل الفعال في مجال الأعمال إلى أنه يجب عليك النظر إلى الكاميرا أثناء التحدث حتى يشعر الناس من الطرف الآخر بأنك تتحدث معهم مباشرةً. لكن هذا غير طبيعي ، فهو لا يسمح لك برؤية رد فعلهم على خطابك. في الواقع ، نحن بحاجة إلى ما حدث بالضبط في سفن الاتحاد الفضائية: شاشات فيديو تعمل في وقت واحد مع الكاميرات بحيث عندما تنظر إلى الشاشة ، ستبدو عينيك متشابهة من الجانب الآخر. بطبيعة الحال ، يحاول المهندسون بالفعل تحقيق هذا التأثير ، ويعملون في عدة اتجاهات.

كل شيء عن المرايا


تتمثل إحدى الطرق البسيطة المعقولة للحفاظ على اتصال العين أثناء مكالمات الفيديو في استخدام التكنولوجيا المستعارة من صناعة التلفزيون: teleprompter . إذا شاهدت الأخبار على شاشة التلفزيون ، ستلاحظ أن المذيع ينظر مباشرة إلى الكاميرا. لا يتعلم المذيعون قصصهم ؛ يقرؤونها من شاشة فيديو خاصة تظهر لتظهر أمام الكاميرا مباشرة. في الواقع ، توجد الشاشة (لوحة مسطحة عادية) في أعلى وجه الكاميرا من الأسفل ، ويظهر النص الموجود عليها في صورة معكوسة. يوجد فوق هذه الشاشة ، أمام الكاميرا مباشرة ، بزاوية 45 درجة ، مرآة جزئية مطلية بالفضة (أو على الوجهين). يرى المذيع فيه انعكاسًا للنص أدناه ، ولا ترى الكاميرا إلا المذيع.



Teleprompters - تقنية بسيطة وجربة ومختبرة ؛ كانت موجودة لأكثر من 60 عامًا. وعندما يتم استخدام هذه الأجهزة في اتصالات الفيديو ، فإنها تُسمى أحيانًا أنفاق الفيديو. لكن لديهم بعض المشاكل. تتمثل إحدى المشكلات في الحجم: إن المعدات ضخمة الحجم إلى حد ما ، لأنها تتطلب مرآة زاوية أمام الكاميرا ، بالإضافة إلى حماية عدسة خاصة من الوهج. وعادة ما تكون أجهزة التحكم عن بعد ثقيلة وهشة ومكلفة - كل هذه العوامل تجعلها غير جذابة للمستهلكين العاديين.

لدي جهاز ProPrompter لسطح المكتب يكلف "فقط" 500 دولار ، والتي يمكن ارتداؤها على جهاز الكمبيوتر الخاص بي (سطح المكتب أو الكمبيوتر المحمول) ، أو على جهاز لوحي. هذا ، في الواقع ، جهاز التحكم عن بعد مصغرة ، ويمكن ترتيب الفيديو بطريقة أن صورة المحاور الخاص بك (بدلا من النص المراد قراءته) سوف تكون مباشرة أمام الكاميرا. إنه أمر مرهق ، لكنه يعمل ، وقد أصبح مفيدًا عندما أقوم بإجراء عروض فيديو عن بعد أمام مجموعات كبيرة ، أو سجل الفيديو في برنامج نصي.

سواء كنت تستخدم جهاز التحكم عن بُعد أم لا - فهناك مشكلة أخرى ، في الحالات التي يشارك فيها أكثر من شخصين في محادثة فيديو. إذا نظرت مباشرة إلى الكاميرا ، ثم إلى كل الأشخاص الذين يرونني على الشاشة ، يبدو أنني على اتصال بصري معهم ، حتى لو كانوا منتشرين في أماكن مختلفة. عندها لن يكون لدى المشاركين انطباع بأن عيني تتحرك عندما أحول انتباهي من شخص لآخر - ولا يمكنني تحديد من ينظر إلي (أو على صورتي) على الشاشة. يحاول نظام GAZE-2 ، الذي يجري تطويره في جامعة كوينز في كينغستون في أونتاريو ، حل هذه المشكلة عن طريق استخدام عدة كاميرات في نفق فيديو ، إلى جانب كاميرا إضافية تهدف إلى توجيه وجهة نظر المستخدم ؛ ينتقل البرنامج إلى الكاميرا الأقرب إلى نظرة المستخدم ويدور الصورة في الطرف الآخر لمطابقة ما يحدث.

تأثير الوجود


الحل المقترح الآخر لمشكلة تحديد اتجاه النظرة ، الذي تم تطويره في جامعة كيو في طوكيو عام 1996 ، كان نظام MAJIC . لقد استبدلت المرآة المزدوجة من جانب الشاشة بشاشة منحنية كبيرة مصنوعة من مادة مثقبة رقيقة توفر سطحًا عاكسًا على جانب واحد ، وتكون شفافة في معظمها من ناحية أخرى. سجلت الكاميرات الموجودة خلف الشاشة المشاركين في المحادثة في مكان واحد ، وأظهرت أجهزة عرض الفيديو العادية صورًا للمشاركين الآخرين (الموجود في مكان واحد أو أكثر) على الشاشة. كانت إحدى الميزات الفريدة لـ MAJIC هي أنه خلف صورة كل شخص على الشاشة ، كان لكل منهما كاميرا أصغر تعمل مع العيون الافتراضية لذلك الشخص في ذلك المكان (ولعب صوته مع السماعة). في النهاية ، بدا أن كل شخص ينظر دائمًا إلى ذلك المشارك في المحادثة التي التفت إليها في الوقت الحالي ، وكان من الممكن رؤية متى نظر أحد المشاركين في المحادثة إلى الآخر. ميزة إضافية: خلقت التوقعات بالحجم الطبيعي شعور الناس يجلسون فعليًا على طاولة مقابل بعضهم البعض. لسوء الحظ ، حسب علمي ، لم يتم عرض هذا النظام أبدًا للبيع ، وهذا ليس مفاجئًا نظرًا لضخامة وتكلفة المعدات.

بعد عشر سنوات ، ظهرت نسخة أكثر إحكاما من هذا النظام. في يناير 2006 ، حصلت شركة Apple على براءة اختراع لنظام فيديو وجهاً لوجه تم فيه دمج مجموعة كبيرة من الكاميرات المجهرية (وفي الواقع ، غير المرئية) في الشاشة مع عناصر العرض ؛ والجمع بين كل هذه الآلاف أو ملايين الصور في واحدة. هذا يجب أن يعطي تأثير مشابه لما اقترحه MAJIC. سيوضح الوقت متى ، أو بأي شكل ، ستصبح تقنية مماثلة متاحة للمستهلكين.

يدرس الآن باحثون من شركات كبيرة مثل HP و Microsoft و AT&T ، من بين أمور أخرى ، ربما يكون هناك نهج واعد أكثر ، يسمى تصحيح النظرة . كل شيء يبدأ بكاميرا فيديو عادية أو اثنتين مثبتتين بجانب شاشة عادية. يغير معالج الفيديو الخاص رقمياً صورة وجه كل شخص في الوقت الفعلي بحيث يبدو أن عينيه ينظران مباشرة إلى الكاميرا ، حتى لو لم يكن الأمر كذلك. في المظاهرات المبكرة ، تبدو هذه الأنظمة مقنعة إلى حد ما - وإن كانت مخيفة بعض الشيء - لكنها ليست جاهزة للاستخدام التجاري بعد. أيضًا ، لم يتم تكييفها حتى الآن للعمل المرضي مع العديد من المشاركين الموجودين في مكان واحد ، أو للاتصال بالعين الانتقائي مع واحد من عدة مشاركين عن بُعد.


إنه لأمر رائع أن التقدم لا يزال صامدًا ، ولكن نظرًا لقوة الحوسبة الضخمة في أجهزة الحوسبة اليوم ، أشعر بالدهشة والإحباط لأنه حتى الآن لا توجد أدوات برمجية متاحة للجميع لتصحيح نظرتهم. من المزعج وجود مثل هذه الأداة بالفعل من قبل - تطبيق Windows يسمى CatchEye الذي يعمل مع Skype و Google Hangouts و Facebook Messenger وغيرها من المنتجات. ومع ذلك ، تم إبعاده من السوق في عام 2017 دون أي تفسير. أود أن أعتقد أن هذا قد حدث لأن المطور تم شراؤه من قبل شركة كبيرة مثل Apple أو Microsoft ، ويعمل الآن بجد لإعطاء هذه الفرصة للجماهير ، لكنني على الأرجح متفائل للغاية. إذا كان بإمكاني فقط النظر إلى عمالقة التكنولوجيا في العين ...

Source: https://habr.com/ru/post/ar459022/


All Articles