البساطة الرياضية قد تكمن وراء سرعة التطور.

يلجأ علماء الكمبيوتر إلى البيولوجيا التطورية للإلهام لإيجاد الحلول المثلى في مجموعات الأبعاد الفلكية



دراسة المساحات الشاسعة من الحلول الممكنة لهذه المشكلة ، نواجه حقيقة أن معظم المسارات ستكون طريق مسدود. لكن التطور ربما وجد طرقًا لزيادة فرص النجاح.

يحب المخلوقون الإصرار على أن التطور يجب أن يجمع ما يصل إلى 300 من الأحماض الأمينية بالترتيب الصحيح ، فقط لإنشاء بروتين بشري وحيد متوسط ​​الحجم. ونظرًا لأنه في كل موقف ، يمكن العثور على واحد من 20 من الأحماض الأمينية المحتملة ، يبدو أن هناك أكثر من 20،300 خيار بحث ، وهو أعلى بكثير من عدد الذرات في الكون القابل للرصد. حتى إذا وجدنا التكرار بسبب بعض هذه الخيارات سوف تكون متكافئة ، فإن احتمال تعثر التطور في المجموعة الصحيحة عن طريق الصدفة والطفرات العشوائية يبدو صعبًا للغاية ، حتى مع مرور مليارات السنين.

العيب الرئيسي لهذه الحجج هو أن التطور لم يختبر هذه التتابعات عن طريق الصدفة: لقد أدت عملية الانتقاء الطبيعي إلى القضاء على ما لا لزوم له. بالإضافة إلى ذلك ، من المحتمل أن تكون الطبيعة قد اكتشفت حلولًا أخرى وطرق لتضييق عدد كبير من الاحتمالات على مجموعات فرعية صغيرة قابلة للدراسة والتي من المرجح أن تقدم حلولًا مفيدة.

يواجه علماء الكمبيوتر مشكلات مماثلة ، والتي تتضمن إيجاد الحلول المثلى بين العديد من الخيارات ذات الحجم الفلكي. يلجأ البعض منهم إلى علم الأحياء بحثًا عن الإلهام - على الرغم من حقيقة أن علماء الأحياء أنفسهم يحاولون فقط فهم كيفية ظهوره في الطبيعة.

تستخدم الخوارزميات الجينية ، وأساليب التحسين التي كانت شائعة لعدة عقود ، مبادئ الانتقاء الطبيعي لإنشاء تصميمات جديدة (للروبوتات ، وأنظمة العقاقير وأنظمة النقل ، من بين أشياء أخرى) ، أو تدريب الشبكات العصبية ، أو تشفير البيانات وفك تشفيرها. تبدأ هذه التقنية بحقيقة أن الحلول العشوائية للمشكلة تعتبر بعض "الكائنات" التي لها خصائص معينة ، أو العناصر التي تم تعريفها "وراثياً" في الكود. هذه الحلول ليست جيدة بشكل خاص ، ولكنها تخضع بعد ذلك لطفرات عشوائية مختلفة (وأحيانًا تغييرات أخرى تنسخ عملية خلط الجينات) وتنتج الجيل الثاني من الكائنات الحية ، والتي بدورها تختبر فائدتها في حل المشكلة. نتيجة لذلك ، بعد العديد من التكرار ، تؤدي هذه العملية إلى ظهور فرد أو قرار جيد التكيف.

ينقل بعض الخبراء هذه الطريقة إلى المستوى التالي ، ويقومون ببرمجة جينية للحصول على برامج يمكنها كتابة البرامج وإنتاج حلول فعالة (يمكن أن تكون "الجينات" هنا عبارة عن سطور من الكود) تبين أن هذا الهدف صعب التحقيق ، لأن على الباحثين أن يفكروا في أنواع معينة من البيانات والهياكل ، بالإضافة إلى العديد من الشروط الأخرى.

ومن المثير للاهتمام ، أن طرق التفكير هذه القائمة على التطور (على وجه الخصوص ، البرمجة الوراثية) تتقاطع نظريًا مع نظرية رياضية كانت دائمًا في مكان ما على هامش علم الأحياء وعلوم الكمبيوتر. في الآونة الأخيرة ، حاول بعض العلماء استخدامه لفهم كيف يمكن للتطور ، الطبيعي والاصطناعي ، أن يعمل بكفاءة ويخلق شيئًا جديدًا ويتعلم كيفية التعلم. كان الشيء الرئيسي هنا هو مفهوم خاص للتعقيد والعشوائية والمعلومات ، والذي لم يكن له تطبيقات عملية - حتى اليوم.

القرود وراء لوحات المفاتيح


هذه النظرية ، التي اخترعت في 1960s ، تعمل مع ما يسمى المعلومات الحسابية. يبدأ من طريقة بديهية للتفكير في الاحتمالات والتعقيد: الفكرة القائلة بأنه بالنسبة لبعض بيانات الإدخال ، سيكون من الصعب حسابيًا كيفية وصف كيفية إنشاء شيء ما بدلاً من إنشائه. خذ هذا التشبيه المعروف مع قرد ، وضغط المفاتيح بشكل عشوائي. احتمالات قيامها بطباعة أول 15000 رقم من الأرقام - صغيرة بشكل يبعث على السخرية - وهي تتناقص بشكل كبير مع زيادة عدد الأرقام.

لكن إذا فسرنا ضغطات المفاتيح كنص عشوائي لبرنامج كمبيوتر يعرض الرقم π ، فإن فرص النجاح أو "الاحتمالية الحسابية" قد تحسنت بشكل جذري. الرمز لعرض أول 15000 رقم من الرقم π في لغة C ، على سبيل المثال ، يمكنك تقليص إجمالي يصل إلى 133 حرفًا.

بمعنى آخر ، تقول نظرية الخوارزمية للمعلومات أن احتمال إعطاء بعض أنواع بيانات المخرجات أعلى بكثير عندما تعمل العمليات العشوائية على مستوى البرنامج الذي يصف هذه البيانات عن مستوى البيانات نفسها ، لأن البرنامج سيكون قصيرًا. وبهذا المعنى ، فإن البنى المعقدة - على سبيل المثال ، الفركتلات - من الأسهل الوصول إليها بالصدفة.

ومع ذلك ، سرعان ما ظهرت مشكلة في هذا النهج: اكتشف علماء الرياضيات أنه لا يمكن حساب التعقيد الحسابي (المعروف أيضًا باسم تعقيد Kolmogorov ، الذي سمي على اسم Andrei Nikolaevich Kolmogorov ، أحد مؤسسي النظرية) لبيانات الناتج المحددة - طول أقصر برنامج ممكن ينتج عنها - . لذلك ، لا يمكن لعلماء الكمبيوتر إيجاد الطريقة المثالية لضغط سلسلة أو كائن آخر.


التعقيد الخوارزمي للشبكة على اليسار مرتفع ، لأنه لوصفها ، تحتاج إلى سرد جميع الحواف التي تربط الرؤوس. في الوسط ، يكون التعقيد أقل ، لأنه عند وصف هذه الشبكة ، يمكننا أن نكتب أن الرأس A يتصل بجميع الشبكات الأخرى. تواجه الشبكة الصحيحة أقل صعوبة ، حيث أن وصفها يتكون من حقيقة أن جميع القمم متصلة بأزواج من الحواف.

ونتيجة لذلك ، تم تطوير نظرية الخوارزمية للمعلومات بشكل رئيسي في مجال الرياضيات البحتة ، حيث يتم استخدامها لدراسة النظريات ذات الصلة وتحديد مفاهيم العشوائية والبنية. بدا استخدامها العملي بعيد المنال. قال عالم الرياضيات الشهير غريغوري شيتين ، أحد مؤسسي النظرية ، الذي عمل في مركز توماس جيه واتسون آي بي إم وجامعة ريو دي جانيرو الفيدرالية: "من الناحية الرياضية ، هذا مقياس بسيط وجميل من التعقيد". "ولكن من وجهة نظر قابلية التطبيق في العالم الواقعي ، بدا منيعة."

لكن هذا لم يجعله يتراجع. وأعرب عن أمله في أن هذه النظرية يمكن استخدامها لإضفاء الطابع الرسمي على فكرة أن الحمض النووي يتصرف مثل البرنامج. في عام 2012 ، نشر كتابًا وصف فيه كيف يمكن تمثيل التطور على أنه تمشي عشوائي في مساحة البرنامج. وكتب أن الطفرات التي تحدث على هذا المسار لا تخضع لتوزيع الاحتمالات العشوائية الإحصائية. يطيعون التوزيع على أساس تعقيد Kolmogorov. لكنه لم يستطع التحقق من ذلك.

الآن ، يأمل بعض العلماء في إحياء هذه النظرية في هذا السياق ، وربطها بالبيولوجيا وعلوم الكمبيوتر في نفس الوقت.

الرغبة في البساطة


هيكتور زينيل ، متخصص تكنولوجيا المعلومات في معهد كارولينسكا في السويد ، هو أحد أولئك الذين يحاولون إحياء هذه النظرية. يعمل مع باحثين آخرين لاستخدام تعقيد Kolmogorov كمقياس لتحليل تعقيد الشبكات البيولوجية - على سبيل المثال ، شبكات تنظيم الجينات أو تفاعل البروتينات في الخلايا. يقدر الباحثون تقريبًا المحتوى الحسابي للشبكة (القيمة الدقيقة غير قابلة للحساب) ، ثم يقومون بتحوير الشبكة والتحقق من مدى تأثيرها على تعقيد Kolmogorov. يأملون في أن تمنحهم هذه الطريقة فكرة عن الأهمية النسبية لمختلف عناصر الشبكة ، وعن استجابتها الوظيفية للتغيرات المتعمدة.


عالم الرياضيات الشهير غريغوري شيتين ، أحد مؤسسي نظرية المعلومات الحسابية

في عمل تم نشره مؤخرًا على arxiv.org ، وصفوا أنه إذا دفعت الشبكة نحو زيادة تعقيد Kolmogorov - إدخال الطفرات التي تجعل برنامج وصف الشبكة يزداد حجمًا - يؤدي ذلك عادةً إلى زيادة عدد الوظائف التي يمكنه القيام بها الشبكة ، في حين جعلها أكثر حساسية للاضطرابات. عندما أجبروا الشبكة على أن تصبح أكثر بساطة ، أصبحت الوظائف أقل ، وازداد الاستقرار.

ومع ذلك ، لا يزال من غير الواضح ما إذا كان تعقيد Kolmogorov يمكن أن يلعب أي دور أكبر من أداة بسيطة - على سبيل المثال ، كما تعتقد Chaytin ، لتكون القوة الدافعة الرئيسية للتغيير. على الرغم من كل المشاكل ، تبدو المعلومات الحسابية بمثابة نظرية جذابة لعلم الأحياء. تقليديا ، لوصف الديناميات التطورية ، استخدمت الرياضيات في مجال علم الوراثة السكانية - النماذج الإحصائية التي تصف تواتر الجينات في السكان. ومع ذلك ، فإن الوراثة السكانية لها حدودها الخاصة: فهي لا تصف أصل الحياة وغيرها من العمليات البيولوجية العابرة الأساسية ، أو ظهور جينات جديدة تمامًا. وقال شيتين "في هذه النظرية الرياضية الجميلة ، فقدت فكرة الإبداع البيولوجي بطريقة أو بأخرى". ولكن إذا أخذنا في الاعتبار المعلومات الحسابية ، "فحينها يتناسب الإبداع بشكل طبيعي مع الصورة الكبيرة".

وكذلك فكرة أن العملية التطورية تتحسن بمرور الوقت وتزيد من الكفاءة. يقول دانييل بولاني ، أخصائي تكنولوجيا المعلومات وأستاذ الذكاء الاصطناعي بجامعة هيرتفوردشاير في إنجلترا: "أنا مقتنع بأن التطور يتعلم". "لن يفاجأ إذا كان يمكن التعبير عن ذلك من خلال انخفاض مقارب في تعقيد حسابي."

قرر فريق Zenil والفريق التجريبي اختبار النتائج البيولوجية والحسابية لتأثير منصة التعقيد الخوارزمي. باستخدام نفس التقنية لتقدير التعقيد الذي استخدموه لتحليل وإزعاج الشبكات ، نفذوا "تطور" الشبكات الوراثية الاصطناعية نحو أهداف محددة - مصفوفات الأصفار وتلك التي تشير إلى تفاعلات الجينات - اختيار الطفرات التي تنتج مصفوفات مع أقل تعقيد حسابي. وبعبارة أخرى ، قاموا باختيار لصالح هياكل أكبر.


هيكتور زينيل ، أخصائي علوم الحاسوب ، معهد كارولين

في الآونة الأخيرة ، نشروا نتائج في مجلة Royal Society Open Science ، والتي استخلص منها أنه ، مقارنةً بالطفرات العشوائية الإحصائية ، أدى اختيارهم للطفرات إلى تسارع كبير في تطوير الشبكات نحو الحلول. ظهرت ميزات أخرى أيضًا ، على سبيل المثال ، هياكل ثابتة ومنتظمة - أقسام من المصفوفات التي وصلت بالفعل إلى درجة معينة من البساطة ، وهو ما يصعب على الأجيال الجديدة تحسينه. وقال زينيل: "كانت المناطق الفردية أكثر عرضة للطفرات إلى حد ما لأنها ببساطة وصلت إلى مستوى معين من البساطة". "لقد كان مشابهًا جدًا للجينات". ساعدت هذه الذاكرة الوراثية الهياكل الكبيرة على الظهور بشكل أسرع - يعتقد الباحثون أن ذلك يتبع أن الطفرات المحتملة حسابيًا يمكن أن تؤدي إلى تفشي التنوع والانقراض.

قال زينيل: "هذا يعني أنه سيكون من المثمر أن نفكر في العمليات الحسابية في دراسة التطور". إنه يأمل في استخدام هذا الفهم للعشوائية والتعقيد لتحديد مسارات التبادل التي قد تكون أكثر عرضة للطفرات ، أو لفهم سبب ارتباط بعض التفاعلات الجينية بأمراض مثل السرطان.

تطور البرنامج


يأمل Zenil في فهم ما إذا كان التطور البيولوجي يعمل وفقًا لنفس القواعد الحسابية ، لكن معظم الخبراء لديهم شكوك. ليس من الواضح الآلية الطبيعية التي يمكن أن تكون مسؤولة عن تقدير تقريبي لتعقيد حسابي أو إجبار الطفرات على التطور بشكل هادف. علاوة على ذلك ، "الاعتقاد بأن الحياة مشفرة بالكامل بأربعة أحرف سيكون خاطئًا" ، هذا ما قاله جوزيبي لونغو ، عالم الرياضيات في المركز الوطني الفرنسي للبحث العلمي. "الحمض النووي مهم للغاية ، لكن لا معنى له خارج الخلية أو الكائن الحي أو النظام البيئي". تعمل التفاعلات الأخرى ، ولا يمكن أن يغطي استخدام المعلومات الحسابية كل هذا التعقيد.

ومع ذلك ، أثار هذا المفهوم بعض الاهتمام - خاصة لأن مثل هذه الآراء حول التطور والعمليات الحسابية لها شيء مشترك ، على الأقل موضوع مشترك ، بهدف البرمجة الجينية - للحصول على برنامج يمكن أن يتطور.

كانت هناك بالفعل إشارات مثيرة للاهتمام إلى العلاقة المحتملة بين أفكار شيتين وزينيل المتعلقة بتعقيد كولموغوروف وطرق البرمجة الجينية. على سبيل المثال ، في عام 2001 ، ذكر فريق من الباحثين أن تعقيد ناتج البرنامج الوراثي محدود بسبب تعقيد Kolmogorov للبرنامج الأصلي.

ولكن بالنسبة للجزء الأكبر ، لم يلعب تعقيد Kolmogorov دورًا في محاولات علماء الكمبيوتر لفهم هذه الأفكار. لقد جربوا طرقًا أخرى لتغيير الوراثة والطفرات. غيرت بعض المجموعات سرعة الطفرات ، بينما أجبرت مجموعات أخرى النظام على التحول إلى الطفرات التي حلت محل أجزاء كبيرة من التعليمات البرمجية. وقال لي سبيكتور ، اختصاصي تكنولوجيا المعلومات في كلية هامبشاير في ماساتشوستس: "لقد توصل الناس إلى العشرات ، وربما المئات ، من إصدارات مختلفة من الطفرات والأنماط الجينية". قاد سبيكتور مؤخرًا فريقًا أظهر فوائد إضافة الطفرات وإزالتها في جميع أنحاء جينوم الجسم عبر الاستبدال المباشر لجين مع آخر. زاد هذا النوع الجديد من العوامل الوراثية بشكل كبير عدد المسارات عبر فضاء البحث الجيني وأدى في النهاية إلى حلول أفضل.


لي سبيكتور ، أخصائي كمبيوتر في كلية هامبشاير ، ماساتشوستس

ومع ذلك ، ذهب العديد من الباحثين في الاتجاه المعاكس ، بحثًا عن طرق مبدعة لتسريع العملية ، وتضييق مجال عمليات البحث ، ولكن دون تقييدها كثيرًا حتى لا يفوت البحث النتائج المثلى. كانت إحدى الأفكار هي جعل البساطة هدفًا: في الستينيات ، أشار يوجين فينر إلى "الفعالية غير المعقولة للرياضيات في العلوم الطبيعية" ، ووجد علماء الكمبيوتر أن النماذج الأكثر بساطة والأناقة أكثر كفاءة وأكثر قابلية للتطبيق في كثير من الأحيان. "السؤال هو ،" قال سبيكتور ، "هل هذه الحقيقة تخبرنا شيئا عميقا حول بنية الكون ، أم لا؟" وهل سيكون من المفيد لنا؟ "

كما يحذر من أن محاولة دفع البرامج المتطورة إلى البساطة يمكن أن تكون مدمرة: يمكن لمكافأة البرامج على الإيجاز أن تقلل من ما يبدو كقمامة الآن ، ولكنها قد تكون مفيدة للأجيال القادمة ، مما يؤدي إلى التضحية بالحلول المثلى. وقال "نحن عالقون".

ومع ذلك ، تظل البساطة هدفًا مغرًا ، وهو ما أثبت فائدته. في بحث نشر العام الماضي ، وجد Spector وزملاؤه أنه إذا قمت بتقليل حجم البرامج - في بعض الأحيان بنسبة 25 ٪ فقط من الطول الأصلي - بعد تطبيق تقنيات البرمجة الجينية ، يمكن للبرامج أن تعمل بشكل أفضل مع البيانات الجديدة ويمكن استخدامها على نطاق أوسع من عامة مشاكل.

وبوجه خاص ، بسبب هذا ، فهو يراقب العمل في مجال نظرية المعلومات الحسابية ، على الرغم من أنه يقول إن تأثيره على هذا المجال من البحث لم يتم رؤيته بعد.

التعلم من الحياة


ربما اتخذ فريق Zenil الخطوة الأولى في البحث عن هذا التأثير - ومع ذلك ، من أجل تطبيق واقعي لعملهم ، يحتاجون أولاً إلى اختبار طريقتهم على أنواع أخرى من مشاكل البحث.

وقالت لاريسا ألبانتاكيس ، عالمة في علم الأعصاب ونظرية في جامعة ويسكونسن ، التي عملت أيضًا على تسريع الخوارزميات الجينية عن طريق الحد من مساحة البحث ، لكنها "أثبتت بشكل مقنع الحاجة إلى قيود تستند إلى البنية". "الطبيعة مهيكلة ، وإذا كنت تأخذ هذا كنقطة انطلاق ، فسيكون من الغباء محاولة اختبار جميع الطفرات المتجانسة الممكنة." وأضافت: "كل شيء منطقي بالنسبة لنا منظم بطريقة ما".

وعلى الرغم من أن سبيكتور يشك في أن عمل زينيل يمكن تطبيقه على شيء خارج نطاق المهمة المحددة التي درسها ، فإن "نظرية المعلومات التي تقوم عليها مفاهيمهم مثيرة للاهتمام وربما مهمة للغاية". "يبدو الأمر مثيراً للاهتمام بالنسبة لي جزئيًا لأنه يبدو غريبًا إلى حد ما." ربما هناك أفكار لا يعرفها الرفاق من مجتمعنا ". في الواقع ، تتعلق المعلومات الحسابية بطائفة واسعة من الأفكار التي قد لا يدرجها بعض خبراء البرمجة الجينية في عملهم ، على سبيل المثال ، الطبيعة غير المحدودة للتطور.

وقال سبيكتور: "لدي شعور قوي بوجود شيء مهم في هذا المجال". ومع ذلك ، أضاف ، حتى الآن "هناك مسافة كبيرة بين عملهم والتطبيقات العملية."

وقال شيتين "إن فكرة تخيل الحياة كبرنامج متطور هي فكرة مثمرة للغاية" ، على الرغم من أن قيمتها ما زالت مبكرة جدًا. سواء كنا نتحدث عن الحياة الاصطناعية أو البيولوجية ، "نحن بحاجة إلى معرفة إلى أي مدى يمكننا أن نذهب".

Source: https://habr.com/ru/post/ar433602/


All Articles