كلمة عن العمليات ، أو أننا جميعًا من وسائل منع الحمل .تأملات مستمرة في ذهن كل من الطبيعية والاصطناعية (AI) ، الجزء الأول هناسؤال عن الردم : هل يعيش الشخص الآن؟ ليس عندما نسير في الشارع ونفكر ملياً في العالم من حولنا ، فنحن نتصرف بشكل أو بآخر في
الوقت الفعلي ... على الرغم من أن ما نراه في الواقع - حتى الآن - سيمر بآليات الاعتراف / التصنيف المعتادة - كل هذا سيكون حديثًا ، ولكن لا يزال الماضي. أي هل يعيش الشخص في الماضي؟
على سبيل المثال: أنت تمشي على طول الشارع ، انظر كلبًا. أو سيارة. في أي حال ، إذا كنا نتحدث عن هذه اللحظة ، فإن هذه المعلومات قديمة بالفعل. إذا عملنا على بيانات مرت بجميع آلياتنا الإدراكية (وكان الدماغ بعيدًا عن أسرع آلة حاسبة!) ، فإننا ببساطة لن نواكب العالم! سوف يهاجم الكلب أو العكس - سوف يهرب ، وستظل رغبتك في ركله خلف الأذن غير مستوفاة ، وستتركك السيارة أو تمر بك ، على الرغم من أنك تريد "التقاط" هذه السيارة بعينها.
لكن الحمد لله لا يحدث بهذه الطريقة ، وهنا السبب: يعمل الدماغ بشكل مختلف. وحدة الإدراك ليست كائنًا ، أو حتى مجمل الكائنات ، ولكنها عمليات. الكلب يعمل. لك أو منك. أو لا يعمل ، ولكن الأكاذيب ، على سبيل المثال. السيارة أيضًا ثابتة (في موقف السيارات) ، أو تتحرك في اتجاه معين. في جميع الحالات ، تتصور عملية ذات مدة زمنية طويلة ، وبالتالي ، تطور معين في المستقبل. عندما أقول إننا نتصور الأحداث التي تكشفت في الوقت المناسب - فهذا ليس رقم خطاب. قم بإجراء تجربة - التقط عشرات الصور (على سبيل المثال ، لقطات فورية للواقع) ووصف ما تراه. إليكم بعض الأشخاص في الغرفة ، وهم يتشاجرون ، أو هنا رجل يمشي على طول الشارع ، أو هنا جالسًا يشاهد التليفزيون ، وهو يقرأ كتابًا. هذه كلها عمليات تستغرق وقتًا طويلاً! كنت ترى يلقي لحظة كشيء له طول. أنت لا تعرف كيفية القيام بذلك بشكل مختلف ، لأن الدماغ يعمل على هذا النحو: يتم تدريبه على التعرف على العمليات ، وليس الأشياء المختلفة على المسرح. تمامًا مثل عدم رؤية أنف العينين ، ولكن وجهًا في المجمع (مرحبًا ، شبكات عصبية تلافيفية).
يتكون العالم من العمليات وليس الأشياء. إذا سألت عن ماهية
التفاحة ، فسيقول معظم البالغين أنها
فاكهة / فاكهة ، وسوف يقول الأطفال إنها
غذاء . لكن كلاهما وصف للعملية ، لأن الأول يعني أن هذه التفاحة
تنمو على شجرة وتخدم الشجرة للتكاثر ، والثانية - أنها
صالحة للأكل . لا أحد ولا الآخر مرتبطًا بالعلامات الفورية للتفاحة - الشكل واللون والحجم ... لأن العلامات تسمح لك بتحديد ، لكن لا تسمح باستخدام أو تفهم مكان استخدامه في العالم ، أي تحديد بالضبط العمليات.
إذا أخذنا مناقشة نموذجية حول طبيعة الوقت ، فإن الافتراضات الكلاسيكية ستكون حول ثبات الماضي (خارج سياق السفر عبر الزمن) ، وأهمية الحاضر (لا يوجد سوى لحظة ... ؛)) ، والمستقبل ، الذي لا وجود له بعد ، مما يعني أنه يمكن تغييره. عندما نتحدث عن الواقع الموضوعي ، قد يكون الأمر كذلك. ومع ذلك ، يعيش الشخص في نموذجه الشخصي الخاص بالعالم ، وهناك كل شيء على عكس ذلك تقريبًا!
الماضي بعيد عن الثبات كما نود. يتلقى الشخص باستمرار معلومات جديدة ،
ويعيد بناء الماضي من أجل القضاء على التناقضات (
كنت تعتقد أن بيوتر ستيبانيك في ندوة ، ويغادر النادي التعريفي ... هذا يعني أنه لم يذهب ، وهو فنان ، ولم يذهب ، وعمومًا ... ). في الوقت نفسه ، فإن مستقبلك الشخصي في كثير من الجوانب ثابت (
مهما كان ، ولكن لدي الجمعة وبيرة وكرة قدم! ). ليس ذلك فحسب ، فبعد أن يكون لديك هدف محدد في المستقبل ، فلن تقوم فقط ببناء سلسلة من العمليات بالترتيب العكسي (
لكي تصبح مديرًا لشركة كبيرة ، فأنت بحاجة إلى التخرج من جامعة مرموقة حاصلة على دبلوم ، لذلك يجب عليك أولاً الدخول فيها ، ولهذا يجب عليك اجتياز الامتحان ، لذلك عليك أن تتعلم المسيرة. الدروس! ) ، ولكن من المحتمل أيضًا - العودة إلى العملية (
ألم يكن لدينا أصدقاء / معارف قد صعدوا الآن ونموهم ويمكن أن يساعدوا طفلاً بجامعة ) - ما هذا ليس من قبيل الغياب؟ ؛)
ومع ذلك ، كنت مشتتا قليلا. ومع ذلك ، فإن الشيء الرئيسي الذي أردت التركيز عليه هو
العمليات . أنا مقتنع تمامًا أن الذكاء الاصطناعي المحتمل يحتاج إلى تدريب ليس في الصورة أو حتى في الفيديو. تحتوي الشبكة التلافيفية على مستويين (الحد الأدنى) - وفي الواقع ، هناك شبكتان مختلفتان: أحدهما مدرب على العثور على أنماط رسومية معينة في الصورة الأولية ، والثاني يتعامل مع إخراج الأول - أي مع المعلومات التي تمت معالجتها وإعدادها بالفعل. للتفاعل بنجاح مع عالم الذكاء الاصطناعى ، فأنت تحتاج إلى نفس الشيء: على مستوى ما (بعيد عن المستوى الأول) ، يجب أن تكون هناك شبكة تتلقى خريطة عمليات تم نشرها زمنياً. مفاهيم "البداية" و "النهاية" ، "الحركة" ، "التحول" ، "الاندماج" و "الانفصال" هي ما يجب أن تتعلمه الشبكة للتعامل معها.
أنا متأكد من أن المشاركين في ألعاب الذكاء الاصطناعي ، مثل Alpha Go ، يفهمون ذلك بطريقة أو بأخرى. ربما تكون هناك طرق مختلفة بعض الشيء ، لكن الجوهر هو نفسه: يتم تحليل الوضع الحالي على السبورة (وفي الكشف عن الحركات القليلة الأخيرة) لما يحدث "على الإطلاق". واعتمادًا على مقدار ما يتوافق مع ما يجب أن يحدث ، يتم اختيار حركاتك الخاصة.
من الصعب للغاية التحدث عن الإستراتيجية / السلوك عندما تكون صورة الإدخال من المستشعرات. والعكس بالعكس - متجه جاهز يحتوي على محاذاة كاملة للحالة الحالية للمجال في الألعاب بمعلومات كاملة (عد الصورة الكاملة للعالم) هي مهمة ممكنة ، كما تظهر الممارسة. ومع ذلك ، إذا حددت الشبكة التلافيفية للمستويات الأولى الكائنات ، والمستويات التالية تحلل هذه الكائنات في الديناميات ، فإن تحديد العمليات (المألوفة من التدريب ، على سبيل المثال) يكمل البيانات التي تم الحصول عليها في وقت سابق ، ثم يبدو من الممكن العمل مع هذا ...
أسئلة للخبراء:ما مدى واقعية ذلك ، بالنظر إلى التطورات الحالية على الشبكات العصبية ، لفعل شيء من هذا القبيل:
عند المدخلات ، على سبيل المثال ، إشارة فيديو مستمرة ، وربما ستيريو. كخيار: مع عدة درجات من الحرية (القدرة على تدوير الكاميرا - بشكل تعسفي ، أو حسب المخطط). ومع ذلك ، إذا لزم الأمر ، يمكن استكمال / استبدال إشارة الفيديو بأي من طرق الإدراك المكاني الأخرى - من السونار إلى الغطاء.
بالمعنى الدقيق للكلمة ...عند المدخلات ، يمكن أن يكون هناك دفق حقيقي - على الأقل خطاب / نص ، على الأقل اقتباسات من العملات ، ولكن ... في العملية قيد النظر ، من الأسهل بالنسبة لي أن أعتمد على عينة السبب الوحيدة المتاحة لي للدراسة المباشرة - الخاصة بي! ) وفي هذه "العينة" القناة الحسية خارج المنافسة!
الإخراج:- خريطة العمق (إذا كانت الكاميرا ثابتة) أو خريطة بيئية. المساحات (الكاميرا الديناميكية / غطاء ، إلخ) ؛
من اجل ماذامن الضروري إذا أردنا الحصول على ترتيب مكاني حقيقي للأشياء لتقييم تفاعلها. في هذه الحالة ، تكون الصورة من الكاميرا مجرد إسقاط ثنائي الأبعاد لمساحة أكبر ، وهناك حاجة إلى تحويلات إضافية.
- تحديد كائنات فردية (مع مراعاة خريطة العمق / الفضاء ، وليس فقط / ليس الكثير من المعالم المرئية) ؛
- تسليط الضوء على الأجسام المتحركة (السرعة / التسارع ، والتخطيط / التنبؤ بالمسار (؟)) ؛
- التصنيف الهرمي للكائنات وفقًا لأي سمات قابلة للاسترداد (الشكل / الأبعاد / اللون / الفروق الدقيقة في الحركة / المكونات (؟)). أي أساسا استرداد المقاييس لهيلبرت الفضاء .
حول التسلسل الهرميربما كلمة "التسلسل الهرمي" ليست مناسبة تماما في هذه الحالة. أود التأكيد على أنه من الممكن في أي وقت اختيار المقاييس بحيث تتيح لنا
مسافة Heming بينهما النظر في مجموعتين مختلفتين من المقاييس كمفهوم واحد. مثل "السيارة الحمراء" و "الحافلة الزرقاء" يجب تعميمها على مفهوم "السيارة" ، على سبيل المثال.
مهم: إذا كان ذلك ممكنًا ، فإن النظام غير مدرّب مسبقًا. أي يمكن وضع بعض الأشياء الأساسية (على سبيل المثال ، شبكة تلافيفية من الطبقة الأولى ، لتسليط الضوء على معالم / هندسة) ، ولكن يجب أن تتعلم تحديد الكائنات والتعرف عليها فيما بعد بنفسك.
- وأخيرًا ، تم إنشاء عملية مسح (استنادًا إلى الفقرات 1.4 ، أي خريطة مكانية مع مراعاة المقاييس) في الوقت المناسب (في الوقت الحالي ، في هذه المرحلة ، تكون الفترة الملاحظة مباشرة مرئية) ، بهدف تحليل النقاط 2-4 ، s من أجل تحديد: العمليات / الأحداث (والتي هي في الأساس تغييرات في الوقت في الفقرة 3) وتصنيفها العنقودي (الفقرة 4).
مرة أخرى: من الصورة من أجهزة الاستشعار ، نقوم أولاً باستخراج وصف العالم في شكل أكثر تحضيرًا ، ويتم تصنيفه وفقًا للسمات القابلة للاسترداد وقسمنا ليس إلى وحدات بكسل ، ولكن إلى كائنات. ثم نقوم بتوسيع العالم ، الذي يتكون من كائنات في الوقت المناسب ، ونرسل "صورة العالم" الناتجة إلى مدخلات الشبكة التالية ، التي تعمل معها مثل الطبقات السابقة مع صورة تعمل باللمس. حيث تبرز معالم الكائنات ، ستظهر الآن "ملامح" العمليات الجارية. يشبه الموضع النسبي للكائنات في الفضاء العلاقة السببية للعمليات في الوقت ... بطريقة ما.
يفترض بعد ذلك ، يجب أن يكون النظام قادرًا على التعرف على العمليات من خلال أجزائه (كقادر على تحديد الصور أو وجود جزء منها أو
كتابة كتابة للنص وفقًا للنموذج ) ، ونتيجة لذلك - للتنبؤ بها ، إلى الأمام والخلف في الوقت المناسب ، وتوسيع النموذج البند 5 غير محدود في كلا الاتجاهين. كذلك ، من المفترض ، بوجود فكرة عن العمليات المركبة ، يمكن للنظام أن يكشف عن عمليات أكثر شمولاً وعالمية ، وبالتالي ، خفية ضمنية تشكل جزءًا لا يتجزأ من العمليات العالمية المحددة ، ولكن لا يتم إدراكها بشكل مباشر ، من خلال العديد من العمليات المحلية ذات الصلة.
حسنًا ، والأخير: وجود حالة ثابتة للنظام في المستقبل (حيث يتم إصلاح عناصر مهمة فقط من مقاييس Hilbert ، مع تفسير مجاني للباقي ، وليس قيمًا مهمة) - هل تستطيع الشبكة "تخمين" البقية؟
حسنًا ، أنا إذا كانت صورة تم فيها تحديد شظيتين فقط غير متصلتين ، فهل يمكن لشبكة تم تدريبها على بعض العينات إكمال صورة كاملة "متسقة"؟ العينة في هذه الحالة هي الفواصل الزمنية نفسها من التجربة ، والشظايا هي الحالة الحالية والمقدمة. النتيجة: "قصة" متسقة تربط واحدة والآخر ...
يبدو لي أن هذا سيكون بالفعل أساسًا جوهريًا لإجراء مزيد من التجارب:
- تضمين في "التاريخ" تصرفات الفرد ، إن أمكن / ضروري
- أولوية أنماط تأثير السبب "العادية" على الانبعاثات العشوائية غير المنضبط (مشكلة الروليت)
- نوع من الفضول ، أي معرفة نشطة للأنماط من خلال العمل ... الخ
ملحوظة: أعترف تمامًا أنني اخترعت دراجة فقط ، وقد ظل الأشخاص ذوو المعرفة يطبقون هذه المبادئ منذ وقت طويل في الممارسة العملية. ؛) في هذه الحالة ، أطلب منك "كزة أنفك" في التطور المناسب. وسيكون رائعا للغاية إذا كان هناك وصف مفصل للمشاكل الأساسية لهذا النهج أو التبرير لماذا لا يعمل من حيث المبدأ.
PPS - أنا أدرك أن النص خام ، والفكر ينتقل من واحد إلى الآخر ، لكنني أردت حقًا أن أطرح على بعض الأشخاص هذه الأسئلة (قسم "سؤال للخبراء") ، وهذا صعب القيام به دون بعض التعريض على الأقل.
النص السابق (وكنت أقوم بإعادة قراءته الآن ، وأدركت أنه من الصعب للغاية فهمه) قد أنجز مهمته: حصلت على بعض المناقشات التي كانت ذات قيمة بالنسبة لي ... آمل هذه المرة أيضًا! ؛)
محدث: على الرغم من السلبيات - لا يزال النقاش الذي تلا ذلك ، وأنا سعيد للغاية عنه!
UPD2: قائمة بالروابط الخاصة بموضوع معين من أشخاص مختلفين في أوقات مختلفة ، أو وجدت نفسي:
- حول تجزئة ، شعبية: ألف ...
- وإذا تعززت رؤية ستيريو؟ واحد ، اثنان ودعونا نقول ثلاثة ...
- كان هذا كل شيء عن OpenCV ، الرياضيات البحتة ، بدون الخلايا العصبية. ويمكنك الجمع بين ذلك ، أو نحو ذلك ... وحتى الآن.
- إذا تم اختيار الكائن ، وفقًا لمجموعة طرق الكائن المذكور سابقًا ، فقد يتم تشكيل مجموعة من علامات تتبعه في المستقبل ...
- لماذا تحتاج إلى البحث عن طرق أخرى عندما يكون هناك تعليم تعزيز كبير؟
- شبكة مدربة مسبقًا تسلط الضوء على الإجراءات على الفيديو ... من الصعب تحديد مدى قابلية التطبيق للتطبيق في حالتنا ، لكنها مثيرة للاهتمام!