قبل عام تقريبًا ، في صيف عام 2017 ، عقدت مدرسة صيفية تقليدية من معهد المعلوماتية الحيوية في MIPT. كان الموضوع الرئيسي للمدرسة هذا العام هو
استخراج البيانات . لماذا؟ كمية البيانات التي تم الحصول عليها في علم الأحياء والطب تنمو بمعدل لا يصدق. في نفس الوقت ، من المستحيل جسديًا اكتشاف الأشياء غير المعروفة سابقًا في مثل هذا الحجم من المعلومات يدويًا (ومع الخوارزميات الكلاسيكية أمرًا صعبًا أيضًا) ، لذلك عليك استخدام الإحصاءات وتكملة الذكاء الطبيعي بالاصطناعية.
هذا ما كان يفعله المشاركون في المدرسة الصيفية بنشاط.
يحتوي هذا المنشور على 22 مقطع فيديو لمحاضرات مع شرائح وأوصاف لجميع المهتمين بموضوع تحليل البيانات في المعلوماتية الحيوية. يتم تمييز المحاضرات التي يمكن مشاهدتها بدون إعداد إضافي بعلامة النجمة "*" (نصفها).
1 *. مقدمة في المعلوماتية الحيوية (ألكسندر بريديوس ، معهد المعلوماتية الحيوية)فيديو |
شرائحتناقش المحاضرة المجالات الرئيسية التي تعمل فيها المعلوماتية الحيوية في العلوم والصناعة ، وخاصة المعلوماتية الحيوية وأسباب شعبيتها اليوم.
2 *. مقدمة لتعلم الآلة (Grigory Sapunov، Intento)فيديو |
شرائحتساهم الزيادة المستمرة في كمية البيانات في تطوير عمليات أكثر تعقيدًا لمعالجة المعلومات والبحث عنها واسترجاعها. طريقة واحدة لحل هذه المشاكل هي استخدام الذكاء الاصطناعي. هذه المحاضرة مخصصة لمقدمة موجزة عن أساسيات التعلم الآلي. أخبر غريغوري المصطلحات العامة في هذا المجال ، ووصف أيضًا أنواع المهام التي تم حلها عن طريق التعلم الآلي. بالإضافة إلى ذلك ، تقدم المحاضرة المراحل الرئيسية للتعلم الآلي وأنواع النماذج ومقاييس الجودة للبيانات المستلمة.
3 *. مقدمة في التعلم العميق (Grigory Sapunov، Intento)فيديو |
شرائحيكتسب التعلم العميق (أو التعلم العميق) حاليًا شعبية بسبب القدرة على عدم وصف خوارزميات محددة لحل المشكلة ، ولكن لاستخدام التدريب في التمثيل. يتم تسهيل تطوير هذه الطرق أيضًا من خلال زيادة قوة المعالجة للمعالجات. المحاضرة مكرسة لأساسيات الشبكات العصبية: أنواعها (شبكات عصبية متصلة بالكامل ، مشفرات تلقائية ، تلافيفية ، متكررة) والمهام التي تحلها. بشكل منفصل ، أوضح غريغوري الحالة والاتجاهات الحالية.
4 *. مقدمة في علم الأورام السرطانية وتحليل بيانات omix في علم الأورام (Mikhail Pyatnitsky ، VN Orekhovich Research Institute of Biomedical Chemistry)فيديو |
شرائحتسلسل الجينوم البشري ، ودراسة الاختلافات الجينية البشرية ، وتسلسل metagenome الإنسان ، والتحليل النسخي للأنسجة البشرية - أعطت كل هذه الأساليب البيولوجية في التطبيق على "البيانات الكبيرة" العلماء الكثير من المعلومات القيمة حول ما يجعل البشر مختلفين عن الحيوانات الأخرى. هذه المحاضرة مخصصة لأوميس واستخداماتها العملية. بشكل منفصل ، تطرق مايكل إلى استخدام هذه البيانات في علم الأورام.
5. Multiomics في علم الأحياء: تكامل التكنولوجيا (Konstantin Okonechnikov ، المركز الألماني لبحوث السرطان)فيديو |
شرائحالتطور السريع للتقنيات التجريبية في علم الأحياء الجزيئي ، مثل التسلسل ، على سبيل المثال ، جعل من الممكن الجمع بين دراسة مجموعة واسعة من العمليات الوظيفية التي تحدث في الخلايا أو الأعضاء أو حتى الجسم كله. تناقش المحاضرة كيفية الجمع الصحيح للبيانات التجريبية الضخمة التي تم الحصول عليها من علم الجينوم ، و transcriptomics و epigenomics لإنشاء علاقات بين مكونات العمليات البيولوجية الجارية. يتم اختيار أمثلة توضيحية لاستخدام التعددية المتعددة من مجال أبحاث السرطان المطلوب بشدة مع التركيز على علم الأورام لدى الأطفال.
6. علم الوراثة الكمي: التاريخ والآفاق (Yuri Aulchenko ، مختبر علم الجينوم الوظيفي النظري والتطبيقي ، FEN NSU ، مجموعة طرق التحليل الجيني ، ICG SB RAS)فيديو |
شرائحعلم الوراثة الكمي هو علم دقيق ، يقوم على عدد صغير من الملاحظات الرئيسية والنماذج الأساسية التي تسمح بالوصف الكمي للظواهر التطورية الطبيعية (الدقيقة) والتنبؤ بنتائج التجارب الجينية. تستخدم جهاز رياضي قوي. تم تطوير العديد من الأساليب الإحصائية الحديثة في الأصل لحل مشاكل علم الوراثة الكمية. إن التطور المذهل للتقنيات البيولوجية الجزيئية على مدى العقد الماضي جعل من الممكن وصف مئات الآلاف من الكائنات الحية بملايين من العوامل الجينومية وغيرها من معلمات "omix". العدد الإجمالي للتجارب والبيانات المتراكمة بالفعل هائلة. إن المهمة العاجلة لعلم الوراثة الكمي الحديث هي تطوير نماذج تصف ميراث البعد المظهري العالي متعدد المستويات. في محاضرته ، قدم يوري لمحة موجزة عن تاريخ علم الوراثة الكمية والمشاكل التي يواجهها هذا العلم.
7 *. تقنيات التسلسل (كيريل غريغورييف ، مركز الجينوم الكاريبي ، جامعة بورتوريكو)فيديو |
شرائحيرتبط تطور وتطور عمليات التسلسل ارتباطًا وثيقًا بتطور القدرات التكنولوجية. توضح المحاضرة تاريخ عملية تطوير تقنيات التسلسل من سانجر وحتى يومنا هذا. بشكل منفصل ، تحدث سيريل عن مزايا وعيوب كل من الأساليب الموجودة حاليًا ، بالإضافة إلى طبيعة البيانات التي تم الحصول عليها وتطبيقها في مختلف المجالات.
8. Transcriptomics: الأساليب العملية والخوارزميات التطبيقية (ألكسندر بريديوس ، معهد المعلوماتية الحيوية)فيديو |
شرائحأخذت Transcriptomics بثقة مكانًا في قائمة المهام الأكثر شيوعًا التي تواجه المعلوماتية الحيوية NGS. يوفر التحليل التفاضلي للتعبير الجيني ، وتجميع بيانات التعبير ، وتفسير البيانات من حيث شلالات التمثيل الغذائي والإشارات معلومات غنية عن أي نظام تقريبًا. تغطي المحاضرة أفضل التخصصات ومجالات المشكلة الرئيسية في تصميم التجارب والمعالجة ، بالإضافة إلى الحالات العملية للتطبيق الناجح لنهج transcriptome.
9. تحليل بيانات NGS في علم الوراثة الطبية: تعريف وتفسير وتفسير المتغيرات الجينية (يوري باربيتوف ، جامعة ولاية سانت بطرسبرغ ، ألكسندر بريديوس ، معهد المعلوماتية الحيوية)فيديو |
شرائحتجاوز استخدام تسلسل جيل جديد لفترة طويلة حدود العلوم الكلاسيكية وتم تطبيقه بنجاح في العديد من المجالات الأخرى ، بما في ذلك الرعاية الصحية. المحاضرة مخصصة للجوانب الرئيسية لتحليل بيانات التسلسل لجيل جديد في علم الوراثة الطبية. أظهر يوري الطريق بأكمله من الحصول على قراءات أولية إلى إجراء التشخيص ، موضحًا الصعوبات التي واجهتها في تحديد المتغيرات الجينية وتعليقها وتفسيرها. بشكل منفصل ، تطرق إلى الأخطاء الشائعة التي ارتكبت في كل مرحلة من مراحل معالجة البيانات. في الختام ، يتم تقديم نظرة عامة موجزة عن مجالات البحث الواعدة التي يمكن أن تحسن دقة التشخيص باستخدام طرق التسلسل عالية الأداء.
10. التطبيق العملي ل ChIP-Seq والطرق ذات الصلة (ألكسندر بريديوس ، معهد المعلوماتية الحيوية)فيديو |
شرائحتُستخدم طرق ChIP-Seq ، بالإضافة إلى "البصمة الجينومية" (ATAC-Seq و FAIRE-Seq و DNase-Seq) على نطاق واسع لإيجاد آليات لتنظيم العمليات البيولوجية ، على وجه الخصوص ، لتنظيم النسخ. المساحة المحتملة للعوامل المدروسة متعددة الأبعاد للغاية ، لكن النهج الانتقائي يسمح للمرء بالحصول على معلومات غنية حول التنظيم في النظام بناءً على عدد قليل من التجارب. باستخدام مثال النظريات الحديثة المتضاربة ، أظهر الإسكندر الصعوبات الرئيسية في تفسير المعلومات التنظيمية ، وكيفية دمج النتائج.
11 *. ماذا يمكنني أن أفعل ببيانات iScan (Tatyana Tatarinova ، جامعة La Verne)فيديو |
شرائحتنتج شركة Illumina عددًا كبيرًا من الأجهزة لتلبية الاحتياجات المختلفة. يسمح لك التقطيع باكتشاف أشكال متعددة من النيوكليوتيدات (SNPs) بسرعة لعدد كبير من العينات. المحاضرة مخصصة لمراجعة البيانات من شرائح iScan وتطبيقها في التشخيص السريري.
12. التعلم العميق في علم الأحياء الحسابي (دميتري فيشمان ، جامعة تارتو)فيديو |
شرائحيستخدم التعلم العميق بنشاط ليس فقط لتحسين الترجمة الآلية أو التعرف على الكلام ، ولكنه يسمح لك أيضًا بحل العديد من المشكلات في مجال علم الأحياء الحسابي. المحاضرة مكرسة لتطبيق أساليب التعلم العميق على أمثلة بيولوجية محددة. تحدث ديمتري عن الجديد في علم الأحياء والطب باستخدام التعلم العميق ، وهل من الممكن القول أن الآلات تحدث ثورة في الطب والبيولوجيا.
13 *. تطبيق طرق التعلم الآلي للبحث عن الطفرات المسببة للأمراض المحتملة في الجينوم البشري (آنا إرشوفا ، معهد موسكو للفيزياء والتكنولوجيا ، معهد أبحاث علم الأحياء الفيزيائي والكيميائي ، جامعة موسكو الحكومية سميت MV Lomonosov ، مركز الأبحاث الفيدرالي لعلم الأوبئة والأحياء الدقيقة المسمى NF Gamalei)فيديو |
شرائحأصبح البحث عن الطفرات المسببة للأمراض وثيق الصلة بتسلسل الجينوم البشري. ومع ذلك ، فمن المستحيل حل هذه المشكلة يدويًا. تدور المحاضرة حول كيف يمكن لتعلم الآلة مساعدتك في القيام بذلك.
14 *. المعلوماتية المناعية (Vadim Nazarov، HSE، IBCh RAS)فيديو |
شرائحلطالما استخدم التعلم الآلي بنشاط في مختلف مجالات الحياة ، ولكن في علم المناعة وجدوا مكانًا له مؤخرًا. في هذه المحاضرة ، تحدث فاديم عن عدة أمثلة لاستخدام الآلة والتعلم العميق في علم المناعة ، بما في ذلك مهمة التنبؤ بربط معقدات MHC-peptide وتحليل ذخيرة مستقبلات الخلايا التائية.
15 *. دراسة التكيف مع المضيف وتطوير المقاومة في فيروسات فيروس نقص المناعة البشرية والتهاب الكبد الوبائي باستخدام طرق المعلوماتية الهيكلية الهيكلية (أولغا كالينينا ، معهد ماكس بلانك للمعلوماتية)فيديو |
شرائحيسبب فيروس نقص المناعة البشرية (HIV) وفيروس التهاب الكبد الوبائي سي أمراضًا خطيرة يصعب علاجها. مثل العديد من فيروسات الرجعية و RNA الأخرى ، تتطور هذه الفيروسات بسرعة ، وبالتالي ، يمكن أن تتكيف مع تأثيرات الأدوية المضادة للفيروسات المحددة والاستجابة المناعية التكيفية من الكائن المضيف. في هذه المحاضرة ، أوضحت أولغا كيف يمكن للمرء ، من خلال الجمع بين تحليل متواليات البروتين الفيروسي وتحليل هيكلها المكاني ، وضع توقعات حول تطوير آليات المقاومة وتفاعل الفيروسات مع جهاز المناعة المضيف.
16. التنبؤ بأثر الطفرات (فاسيلي رامنسكي ، MIPT)فيديو |
شرائحتوفر طرق التسلسل الحديثة كمية هائلة من المعلومات حول تعدد الأشكال للجينوم ، أي الاختلافات بين الجينومات الفردية عن بعضها البعض. تنشأ هذه الاختلافات (المتغيرات) نتيجة للطفرات أثناء تكرار الحمض النووي ويتم إصلاحها جزئيًا في السكان. يختلف انتشار المتغيرات الجينومية وتوطينها وتأثيرها الوظيفي اختلافًا كبيرًا - من الوفيات الكاملة إلى عدم وجود أي تأثير على النمط الظاهري الفردي. تناقش المحاضرة الأساليب الحديثة للتنبؤ بالتأثير الوظيفي للخيارات المستخدمة في الطب الشخصي وعلم الوراثة الطبية والسكان.
17. نمذجة وتصميم متعدد الجزيئات البيولوجية (نيكولاي دوكوليان ، جامعة نورث كارولينا في تشابل هيل)فيديوتغطي حياة الجزيئات البيولوجية مقاييس الوقت والطول المقابلة للمقاييس الزمنية والأطوال من الذري إلى الخلوي. وبالتالي ، يجب أن تكون الأساليب الجديدة للنمذجة الجزيئية متعددة المقاييس بطبيعتها. وصف نيكولاي في محاضرته العديد من المنهجيات التي تم تطويرها في مختبره: خوارزمية للنمذجة الجزيئية الديناميكية المنفصلة السريعة ، وتصميم البروتين ، وأدوات التحسين الهيكلي. باستخدام هذه المنهجيات ، يمكن وصف العديد من التطبيقات التي تسلط الضوء على المسببات الجزيئية للتليف الكيسي وتجد استراتيجيات صيدلانية جديدة لمكافحة هذا المرض ، ونمذجة هيكل الحمض النووي الريبي ثلاثي الأبعاد ، وتطوير مناهج جديدة للتحكم في البروتينات في الخلايا الحية والكائنات الحية.
18. الطي المتماثل للبروتينات (Pavel Yakovlev ، BIOCAD)فيديوفي علم الأحياء الهيكلي الحديث ، هناك عدد من الطرق الحسابية التي تجعل من الممكن وصف الجزيئات البيولوجية بموثوقية عالية ، تشابهها واختلافها ، طرق التفاعل والوظائف. لإنشاء مثل هذه الحسابات ، تعمل المعلمة المكانية للبروتين دائمًا كمعلمة إدخال ، ومع ذلك ، يمكن أن يكون تحضيرها صعبًا ، على الرغم من نصف قرن من التقدم في مجال علم البلورات. المحاضرة مكرسة لحل هذه المشكلة بمساعدة النمذجة المتجانسة لتراكيب البروتين - بناء تراكيب ثلاثية الأبعاد من أجزاء متشابهة. على سبيل المثال ، نعتبر المجالات المتغيرة للأجسام المضادة - البروتينات ذات التنوع الهيكلي الفريد للحلقات المتغيرة.
19. كيفية التوقف عن التأمل وبدء النمذجة (Arthur Zalevsky ، جامعة موسكو الحكومية المسماة MV Lomonosov)فيديو |
شرائحلا تسمح كمية كبيرة من البيانات التي تم الحصول عليها بواسطة طريقة NGS بالحصول على استنتاجات بيولوجية من هذا فحسب ، ولكن أيضًا لاستخدامها في النمذجة. تتيح النماذج التي تم إنشاؤها الفهم الأفضل للبيانات البيولوجية والحصول على المزيد من المعنى البيولوجي من التجربة. المحاضرة مخصصة للنمذجة والمراحل الأولية لهذه العملية.
20 *. الوقوف على أكتاف العمالقة ، أو لماذا نحتاج إلى اتحادات (German Demidov ، مركز التنظيم الجينومي ، معهد برشلونة للعلوم والتكنولوجيا ، جامعة بومبيو فابرا)فيديو |
شرائحعلى مدى العقود الماضية ، ارتبط تطور علم الأحياء بتراكم صفائف البيانات ، وهو ضخم للغاية لدرجة أن مجموعات البحث الفردية لم تعد قادرة على التعامل مع تحليلها للمعلوماتية الحيوية. من أجل حل هذه المشكلة ، بدأ إنشاء اتحادات من عشرات المختبرات ، مثل مشروع الجينوم البشري ، 1000GP ، ENCODE وغيرها. بفضل هذا التعاون ، هناك أنواع مختلفة من البيانات في المجال العام ، والتي تم الحصول عليها باستخدام تقنيات مختلفة. ونتيجة لذلك ، أصبحت مقارنة البيانات التجريبية الجديدة بالبيانات الحالية جزءًا قياسيًا في أي دراسة. لا تنتج اتحادات البيانات فقط ، ولكن أيضًا خطوط الأنابيب المعلوماتية الحيوية لمعالجتها ، والأشكال القياسية ، وإجراءات تقييم الجودة. تناقش هذه المحاضرة كيفية عمل الاتحاد ، وكيفية استخدام نتائج عملهم وماذا تفعل إذا وجدت نفسك فجأة عضوًا في مثل هذا الاتحاد وكنت بحاجة إلى معالجة تيرابايت من البيانات ، ثم مشاركة النتائج مع جميع المشاركين الآخرين.
21 *. نظرة عامة على شركات المعلوماتية الحيوية في روسيا والعالم (Andrey Afanasyev، yRisk)فيديو |
شرائحفي العالم الحديث ، تتشابك العلوم والأعمال أكثر فأكثر. هذا الاتجاه ومجال المعلوماتية الحيوية لم يتجاوزا. تحدث أندري عن توقعات وواقع السوق ، وقصص النجاح وقصص الفشل ، عن الأشخاص والأماكن المتعلقة بالمعلوماتية الحيوية.
22. تحليل متقدم للاختلافات (SNV ، InDel ، SV) باستخدام متصفح الجينوم NGB (Gennady Zakharov ، EPAM ، IP Pavlov Institute of Physiology ، RAS)فيديو |
شرائحتغطي المحاضرة عملية التحليل البصري للتغيرات البسيطة (SNV و InDel) والهيكلية في متصفح الجينوم. يتم عرض جميع الأمثلة باستخدام متصفح NGB ، الذي يلبي معظم متطلبات وتوصيات تحليل الاختلافات الهيكلية ، بما في ذلك الأنواع المختلفة من التصورات والحصول على التعليقات التوضيحية من قواعد البيانات الخارجية. في محاضرة عن أمثلة حقيقية ، يتم عرض سيناريوهات التحقق وتحليل نتائج التغيرات البسيطة والهيكلية.
خاتمة
بالنسبة لأولئك الذين
لا يفهمون أي شيء ، فإنهم يريدون التطوير في مجال المعلوماتية الحيوية - حتى 27 مايو ، لا يزال قبول الطلبات
للمدرسة الصيفية في
عام 2018 هذا مفتوحًا. ستعقد المدرسة نفسها في الفترة من 23 إلى 28 يوليو بالقرب من سانت بطرسبرغ. هناك فرصة للقفز إلى السيارة الأخيرة وإظهار كل شخص بفخر مشاركة مع نظرة عامة على محاضرات العام المقبل ، قائلين إنهم رأوها شخصيًا.
في عام 2017 ، تم عقد المدرسة بدعم من شركائنا المنتظمين -
JetBrains و
BIOCAD و
EPAM Systems ، والذي
يشكرهم كثيرًا .
بالمناسبة ،
مشاركة مع محاضرات من العام السابق للمدارس .
جميع المعلوماتية الحيوية!