AlphaFold: استخدام الذكاء الاصطناعي للاكتشافات العلمية

مرحبا مرة أخرى! نحن نشارك منشورًا ، تم إعداد ترجمته خاصة لطلاب الدورة التدريبية "الشبكات العصبية في بيثون" .



اليوم سوف نتحدث عن أول حدث مهم في تاريخ تطور DeepMind ، لإظهار كيف يمكن للبحوث التي تستخدم الذكاء الاصطناعي أن تحفز ظهور الاكتشافات العلمية. نظرًا لطبيعة عملنا المتعددة التخصصات ، جمعت DeepMind خبراء من مجالات البيولوجيا الهيكلية والفيزياء والتعلم الآلي لاستخدام الأساليب المتقدمة للتنبؤ بالهيكل ثلاثي الأبعاد للبروتين الذي يعتمد فقط على تسلسله الوراثي.

يعتمد نظام AlphaFold الذي نعمل عليه خلال العامين الماضيين على سنوات عديدة من الخبرة البحثية باستخدام بيانات الجينوم الواسعة للتنبؤ بهيكلة البروتين. تعد نماذج البروتين ثلاثية الأبعاد التي تولدها AlphaFold أكثر دقة من تلك التي تم الحصول عليها مسبقًا. هذا تقدم ملحوظ في واحدة من المهام الرئيسية لعلم الأحياء.

ما هي مشكلة البروتين للطي؟


البروتينات هي جزيئات كبيرة ومعقدة ضرورية للحفاظ على الحياة. تقريبًا ، يمكن تتبع جميع وظائف الجسم تقريبًا ، سواء أكان ذلك تقلص العضلات أو إدراك الضوء أو تحويل الطعام إلى طاقة ، إلى بروتين واحد أو أكثر وكيفية تحركها وتغييرها. يتم ترميز وصفات هذه البروتينات ، التي تسمى الجينات ، في الحمض النووي لدينا.

تعتمد خصائص البروتين على هيكله ثلاثي الأبعاد الفريد. على سبيل المثال ، تكون بروتينات الجسم المضاد التي تتكون من جهاز المناعة لدينا "على شكل حرف Y" وتبدو وكأنها خطافات خاصة. تمسك بروتينات الجسم المضاد بالفيروسات والبكتريا ، يمكنها اكتشاف وتسمية مسببات الأمراض للتدمير اللاحق. وبالمثل ، فإن بروتينات الكولاجين في شكل حبال تنقل التوتر بين الغضاريف والأربطة والعظام والجلد. تشمل الأنواع الأخرى من البروتينات Cas9 ، التي تعمل وفقًا لتسلسل كريسبر ، بمثابة مقص يقطع الدنا ويدخل مواقع جديدة. بروتينات التجمد ، التي يسمح هيكلها ثلاثي الأبعاد بالربط ببلورات الجليد ومنع تجميد الكائنات الحية ؛ والريبوسومات ، التي تعمل بمثابة ناقل مبرمج يشارك في بناء البروتينات.

إن تحديد البنية الثلاثية الأبعاد للبروتين فقط من تسلسله الجيني هي مهمة صعبة ظل العلماء يناضلون معها منذ عقود. المشكلة هي أن الحمض النووي لا يحتوي إلا على معلومات حول تسلسل اللبنات الأساسية لبروتين يسمى بقايا الأحماض الأمينية التي تشكل سلاسل طويلة. يُعرف التنبؤ بكيفية تشكيل هذه السلاسل لهيكل بروتين ثلاثي الأبعاد معقد باسم "مشكلة طي البروتين".

كلما زاد حجم البروتين ، زادت صعوبة وضع النماذج ، حيث يتم تكوين روابط أكثر بين الأحماض الأمينية التي يجب أخذها في الاعتبار. على النحو التالي من مفارقة Levintal ، لسرد جميع التكوينات المحتملة لبروتين عادي ، قبل أن يتحقق تركيبه الصحيح ثلاثي الأبعاد ، سيستغرق الأمر وقتًا أكثر من الكون الموجود.



ما أهمية البروتين القابل للطي؟


إن القدرة على التنبؤ بشكل البروتين مفيدة للغاية لأنه أساسي لفهم دور البروتين في الجسم ، وكذلك تشخيص وعلاج أمراض مثل مرض الزهايمر ، الشلل الرعاش ، مرض هنتنغتون والتليف الكيسي ، الذي يعتقد الأطباء أنهما سببهما بروتينات مطوية بشكل غير صحيح.

يسعدنا بشكل خاص أن القدرة على توقع شكل البروتين يمكن أن تحسن فهمنا لكيفية عمل أجسامنا ، وهذا سيتيح لنا تطوير عقاقير جديدة بكفاءة. نظرًا لأننا نحصل على مزيد من المعلومات حول أشكال البروتينات وكيف تعمل من خلال النمذجة ، فإن فرصًا جديدة لإنتاج العقاقير تتفتح ، فضلاً عن خفض تكلفة التجارب. في نهاية المطاف ، ستعمل هذه الاكتشافات على تحسين نوعية حياة ملايين المرضى حول العالم.

إن فهم عملية طي البروتين يمكن أن يساعد أيضًا في تطوير نوع من البروتين يسهم بشكل كبير في الواقع المحيط. على سبيل المثال ، يمكن للتطورات التي تحققت من خلال تطوير البروتين في مجال الإنزيمات القابلة للتحلل الحيوي أن تساعد في التعامل مع الملوثات مثل البلاستيك والزيت ، مما يساعد على تحطيم النفايات دون الإضرار بالبيئة. في الواقع ، بدأ الباحثون بالفعل في تصميم البكتيريا التي تفرز البروتينات التي تجعل النفايات قابلة للتحلل الحيوي وتسهل التعامل معها.

من أجل تحفيز البحث وتقييم التقدم المحرز في مجال أحدث الأساليب لتحسين دقة التنبؤ ، تم إطلاق مسابقة واسعة النطاق لمدة عامين في عام 1994 تسمى تجربة مجتمع CASP في التقييم النقدي لطرق بنية البروتين (CASP) ، والتي أصبحت المعيار الذهبي في أساليب التقييم.

كيف ستحدث منظمة العفو الدولية فرقًا؟


خلال العقود الخمسة الماضية ، تمكن العلماء من التعرف على أشكال البروتينات في المختبر باستخدام طرق تجريبية مثل المجهر الإلكتروني بالتبريد أو الرنين المغناطيسي النووي أو حيود الأشعة السينية ، ولكن تم استنباط كل طريقة من خلال العديد من التجارب والأخطاء التي استغرقت سنوات وتكلفت عشرات الآلاف من الدولارات. لهذا السبب يلجأ علماء الأحياء الآن إلى طرق الذكاء الاصطناعي كبديل للعملية الطويلة والشاقة للبحث عن البروتينات المعقدة.

لحسن الحظ ، يحتوي مجال الجينوم على بيانات كافية بسبب الانخفاض السريع في تكلفة التسلسل الجيني. نتيجة لذلك ، في السنوات القليلة الماضية ، أصبحت النهج الخاصة بمشكلة التنبؤ باستخدام التعلم العميق والقائمة على بيانات الجينوم أكثر شيوعًا. أدى عمل DeepMind حول هذه المشكلة إلى ظهور AlphaFold ، والذي قدمناه إلى CASP هذا العام. نحن فخورون بكوننا جزءًا من التقدم الذي وصفه خبراء CASP بـ "تقدم غير مسبوق في قدرة الطرق الحسابية على التنبؤ بهيكل البروتين". نتيجة لذلك ، احتلنا المركز الأول في ترتيب الفرق (نحن A7D).

ركز فريقنا بدقة على مهمة نمذجة النماذج المستهدفة من البداية ، دون استخدام البروتينات التي سبق حلها كقوالب. لقد حققنا درجة عالية من الدقة في التنبؤ بالخصائص الفيزيائية لهيكل البروتين ، ثم استخدمنا طريقتين مختلفتين للتنبؤ بهياكل البروتين الكاملة.

استخدام الشبكات العصبية للتنبؤ بالخواص الفيزيائية


استخدمت كلتا الطريقتين شبكات عصبية عميقة مدربة على التنبؤ بخصائص البروتين من خلال تسلسله الجيني. الخصائص التي تتوقعها الشبكة هي: (أ) المسافة بين أزواج الأحماض الأمينية و (ب) الزوايا بين الروابط الكيميائية التي تربط هذه الأحماض الأمينية. كان التطور الأول بمثابة تقدم حقيقي في استخدام الأساليب الشائعة التي تحدد ما إذا كانت أزواج الأحماض الأمينية بجوار بعضها البعض.

قمنا بتدريب الشبكة العصبية للتنبؤ بتوزيع منفصل للمسافات بين كل زوج من بقايا البروتين. ثم تم دمج هذه الاحتمالات في تقدير يوضح مدى جودة بنية البروتين المصممة. قمنا أيضًا بتدريب شبكة عصبية أخرى تستخدم جميع المسافات بشكل إجمالي لتقييم مدى قرب البنية المقترحة من الإجابة الصحيحة.





طرق جديدة للتنبؤ بنيات البروتين


باستخدام وظائف التقييم هذه ، تمكنا من العثور على هياكل تناسب توقعاتنا. تعتمد الطريقة الأولى على الأساليب المستخدمة على نطاق واسع في البيولوجيا الهيكلية ؛ فقد استبدلت مرارًا وتكرارًا أجزاء من بنية البروتين بشظايا جديدة. قمنا بتدريب الشبكة العصبية التنافسية التوليدية لاقتراح شظايا جديدة تستخدم لتحسين تقييم بنية البروتين المقترحة بشكل مستمر.



الطريقة الثانية تحسين الدرجات باستخدام النسب التدرج ، (طريقة رياضية تستخدم عادة في التعلم الآلي لتحسينات تدريجية صغيرة) ، مما أدى إلى دقة عالية من الهياكل. تم تطبيق هذه الطريقة على سلاسل البروتين بأكملها ، وليس على القطع التي يجب تكديسها بشكل منفصل قبل التجميع ، مما يقلل من تعقيد عملية التنبؤ.

ما التالي؟


يوضح نجاح اختبار قلم تخثر البروتين أن أنظمة التعلم الآلي يمكنها دمج مصادر متعددة للمعلومات لمساعدة العلماء على تطوير حلول إبداعية للمشاكل المعقدة بسرعة. لقد رأينا بالفعل كيف تساعد الذكاء الاصطناعي الأشخاص على إتقان الألعاب المعقدة من خلال أنظمة مثل AlphaGo و AlphaZero ، ونأمل أيضًا أنه بمجرد أن تساعد طفرة الذكاء الاصطناعي البشرية على حل المشكلات العلمية الأساسية.

من المثير للاهتمام أن نرى التقدم الأول في طي البروتين ، مما يدل على فائدة الذكاء الاصطناعي في تحقيق الاكتشافات العلمية. على الرغم من أنه لا يزال أمامنا الكثير مما يتعين علينا فعله ، إلا أننا ندرك بوضوح أننا سنكون قادرين على المساهمة في البحث عن علاج الأمراض المختلفة ، ومساعدة البيئة وأكثر من ذلك بكثير ، لأن هذه الإمكانات هائلة في الواقع. من خلال فريق متخصص يركز على استكشاف كيف يمكن للتعلم الآلي التقدم في عالم العلوم ، سوف نستكشف الطرق والأساليب المختلفة التي يمكن أن تؤثر بها التكنولوجيا الخاصة بنا على العالم من حولنا.

Source: https://habr.com/ru/post/ar453848/


All Articles