
ما الذي يشترك فيه الثلج والكرنب الروماني ونجم البحر والبرق والأشجار؟ لن تقول ذلك على الفور ، ولكن من وجهة نظر رياضية ، كل هذه الكائنات لها ميزة مشتركة - كسورية. في عيون الرياضيات ، كل شيء في عالمنا يطيع قوانين "ملكة العلوم". يمكن التعبير عن أي ظاهرة أو عملية أو كائن في شكل رياضي ، مما يسمح بتحليله من زاوية جديدة ، إذا جاز التعبير. لسنوات عديدة ، كان العلماء يحاولون إنشاء تمثيل رياضي مثالي للجينات وعلاقاتهم والعمليات التي يشاركون فيها. اليوم سنتحدث عن كيف ساعدت الفركتلات في إرساء الأساس لنموذج رياضي جديد تمامًا للجينات البشرية من منظور السرطان. ما هو كسورية ، لماذا هو مهم جدا لعلماء الوراثة وعلماء الرياضيات ، وكيف يمكن أن يساعد نموذج رياضي جديد الطب الحديث؟ سوف نبحث عن إجابات في تقرير مجموعة الأبحاث. دعنا نذهب.
تراجع نظريبادئ ذي بدء ، يجدر بك معرفة مدى الفراكتل وما الذي يتم تناوله به لفترة وجيزة.
كسورية هي مجموعة ذات خصائص التشابه الذاتي. ببساطة ، عندما يتكون شيء ما من عدة نسخ مصغرة من نفسه.

توجد فركتلات في ظواهر مادية مختلفة: من الانتشار إلى الاضطراب. هذا يمكن أن يسمى المظاهر الطبيعية للكسور. وجد الأشخاص أيضًا استخدام صور النمطي هندسي متكرر: في رسومات الكمبيوتر ، هندسة الراديو ، تقنيات الشبكات ، إلخ.
صور النمطي هندسي متكرر للغاية في فيلم "Doctor Strange" (2016) ، عندما يرسل Elder بطل الرواية في رحلة على طول أبعاد متوازية.
مشهد غير سارة بعض الشيء ، ولكن يدل بوضوح كسورية.حتى على رفوف السوبر ماركت ، يمكنك العثور على مظاهر الانكسار ، وهي مثال ملفوف رومانيسكو أو قرنبيط.
إذا أخذنا في الاعتبار أن هناك الكثير من أنواع المجموعات ذات الخصائص النمطي هندسي متكرر ، يمكن القول أن كل شيء حولنا تقريبًا يرتبط بطريقة أو بأخرى بالفركتلات. والجسم البشري ، وخاصة جيناته ، ليس استثناءً. بما أنه يمكن شرح الفركتلات رياضياً عن طريق فرز المكونات ، فإن استخدام مثل هذا النموذج على الجينات البشرية يمكن أن يساعد بشكل كبير في فهم العمليات المختلفة التي تحدث في أجسامنا ، بما في ذلك الأمراض المختلفة والأمراض وغيرها من الأشياء غير السارة.
واحدة من أهم العمليات في الجسم هي التعبير الجيني (الصورة
1 أ ) ، عندما تتحول المعلومات الوراثية للجينات إلى منتج وظيفي. بمعنى آخر ، فإن خلايانا من خلال التعبير الجيني تتحكم في بنيتها ووظيفتها. جيناتنا هي قاعدة بيانات تستمد منها جميع خلايا الجسم المعلومات ، وتؤدي الوظائف اللازمة بعد ذلك. لذلك ، فمنا لا ينمو الشعر ، والجهاز المناعي يحارب الالتهابات ، وتنقل خلايا الدم الأكسجين ، إلخ. تحدث كل هذه العمليات على وجه التحديد بسبب برمجة الخلايا لأداء مهام محددة ، وهذا بدوره ممكن من خلال تخليق البروتين من تفعيل جين معين.
الصورة رقم 1يشير تنظيم التعبير الجيني إلى متى ، وكم ، وإلى متى يجب إنتاج بروتينات معينة. لذلك ، فإن دراسة هذه العملية ذات أهمية كبيرة لفهم كامل لكيفية عمل آليات معينة لمراقبة الكائنات الحية.
هذه العملية المعقدة مهمة بالنسبة للعلماء ، حيث إن لديهم الفرصة للسيطرة عليها ، فسيكونون قادرين على إنشاء خلايا اصطناعية معينة تتمتع بوظائف واضحة ، ولا سيما إيصال دواء السرطان إلى "قلب" المرض من أجل علاج أكثر فعالية.
من أجل تحسين طرق علاج مثل هذه الأمراض ، من الضروري معرفة الجانب الوراثي بمزيد من التفصيل. للقيام بذلك ، يقترح العلماء تقديم جسم الإنسان في شكل برنامج ، حيث تكون الجينات بمثابة سطور من التعليمات البرمجية التي يمكن تغييرها إذا كان البرنامج يعمل مع خلل. لتحقيق ذلك ، يجب عليك أولاً إنشاء نموذج رياضي للجين. في الوقت الحالي ، توجد هذه النماذج بالفعل ، لكنها لا يمكن أن تكون تمثيلية لأنها تهدف إلى دراسة ديناميات شبكة الجينات. في هذه الدراسة نفسها ، التي طبقت مفهوم الفركتلات ، قرر العلماء التركيز على عملية التعبير عن جين معين ، ثم تطبيق العلاقة المتبادلة بين أزواج الجينات
FT * (
1 ب ).
عامل النسخ (FT) * هو بروتين تحكم توليف مرنا يحتوي على معلومات حول التركيب الأساسي للبروتينات في مصفوفة الحمض النووي من خلال الارتباط بمواقع الحمض النووي المحددة.
ببساطة ، قرر العلماء أن يحفروا أعمق قليلاً ، بعد أن فحصوا "الجدار" ككل ، ولكن "الطوب" الفردي.
نتائج البحوثالمواضيع في هذه الدراسة هي الفطريات Saccharomyces cerevisiae (خميرة الخباز) والبكتيريا Escherichia coli (الإشريكية القولونية).
من خلال تحليل البيانات الإحصائية للتعبير الجيني للمواضيع التجريبية ، تم حساب
معامل هورست * .
معامل هيرست * هو مقياس لتحليل السلاسل الزمنية.
السلاسل الزمنية * - مجموعة من البيانات الإحصائية التي يتم جمعها على فترات زمنية مختلفة حول المؤشر.
الصورة رقم 2يوضح الشكلان 2 أ (الخميرة) و
2 ب (الإشريكية القولونية)
رسومات بيولوجية ثنائية الحساب من التقلبات كدالة لجدول السلاسل الزمنية للوقت FT.
الرسم البياني Bilogarithmic * هو رسم بياني للبيانات ثنائي الأبعاد يستخدم مقياس لوغاريتمي على كلا المحورين (العمودي والأفقي).
يتوافق ميل المنحنى في هذه الرسوم البيانية مع معامل هورست. تجدر الإشارة إلى أن 95 ٪ (الخميرة) و 98 ٪ (العصوية) من السلسلة الزمنية للجينات أظهرت
الاعتماد على المدى الطويل * .
الاعتماد على المدى الطويل * - مؤشر في تحليل السلاسل الزمنية ، يشير إلى التخفيف البطيء للاعتماد الإحصائي لنقطتين مع زيادة الفاصل الزمني بينهما. يتم تحديده بواسطة مؤشر Hurst لمعامل - من 0 إلى 1. إذا كان المؤشر أعلى من 0.5 ، فلدينا علاقة قوية طويلة الأجل ، أقل من 0.5 - التأثير المعاكس.
كان معامل هيرست للاعتماد طويل الأجل في هذه الحالة بالذات 0.5 ، مما يدل على غيابه ، من الناحية النظرية. ومع ذلك ، أظهر المزيد من التحليل للبيانات أن هذا المؤشر يتجاوز قيمة 0.5 ، مما يدل على وجود اعتماد طويل الأجل للسلسلة الزمنية في التعبير الجيني (
2 ج و
2 هـ ). هذا يشير إلى أنه لا يمكن اعتبار السلسلة الزمنية لـ gene-FT شيئًا عشوائيًا ، وبالتالي يجب أن تصمم على أساس سلسلة Markov ، عندما تكون هناك سلسلة من الأحداث ، تعتمد العشوائية لكل منها على الحدث السابق فقط.
مثل الجينات ، أظهرت عوامل النسخ أيضًا وجود علاقة طويلة الأمد: عند 97٪ للخميرة والعصية (الرسوم البيانية
2d و
2f ).
الآن إضافة قليل من تحليل كسورية إلى وعاء مشترك. بادئ ذي بدء ، يلفت العلماء انتباهنا إلى ثنائية توزيع توزيع هورست. من الأفضل رؤية ذلك في الرسوم البيانية
2c و 2e. يفسر العلماء هذه الملاحظة من خلال حقيقة أن هناك عمليات نشر في التعبير الجيني لها عدة إمكانات للنشر. لذلك ، يمكن تفسير ثنائية الأطراف من خلال حركة براوني بلا إرادة مع إمكانات مختلفة. لكن هذا البيان يتطلب أدلة إضافية ، والتي سوف يبحث عنها العلماء في الدراسات التالية.
والآن سوف نعود إلى multifractality. استخدم العلماء تحليلًا متعدد الفركتلات لتذبذب التقلبات لتحديد وجود / عدم وجود خصائص متعددة الفركتلات في السلاسل الزمنية للتعبير الجيني. أظهر هذا التحليل وجود كل من الجينات و FT.
طبق العلماء أيضًا منهجية
bootstrap * لتحديد بدقة (بشكل أدق ، لتأكيد) وجود الاعتماد طويل الأجل ، بالنظر إلى الأطوال المحدودة للسلسلة الزمنية التجريبية.
Bootstrap * - تقنية لتحليل إحصائيات توزيعات الاحتمالات.
لكل سلسلة زمنية من التعبير الجيني ، تم إعداد 10 فواصل زمنية عشوائية ، كل منها يحتوي على 90 ٪ من الجزء المرتب من السلسلة الزمنية الأولية. علاوة على ذلك ، بالنسبة لجميع الخيارات ، تم حساب معامل هورست. وهكذا ، تم الحصول على الفرق بين مؤشرات السلسلة الزمنية التجريبية والإصدارات العشوائية. بالنسبة لـ E. coli ، كان الفرق 0.006٪ فقط ، وبالنسبة لخميرة الخباز أقل - 0.0001٪. وبالتالي ، تم تأكيد وجود الاعتماد على المدى الطويل في كل العينات.
بعد النظر في خصائص الجين و FT بشكل منفصل التي تهم ، بدأ العلماء في تحليل أزواج الجينات FT ككائن واحد. أظهر حساب مؤشر الارتباط المتبادل أن 98 ٪ من أزواج الجينات - FT (في كلتا العينات) تمتلك خصائص الاعتماد على المدى الطويل (
3A ).
الصورة رقم 3أكد تحليل متعدد الفركتلات لتقلبات التجاوز وجود ميزات متعددة الفركتلات في أزواج الجينات - FT (الرسم البياني
3 ب ).
تجدر الإشارة إلى أنه بغض النظر عن حقيقة أن كلا من الارتباط المتبادل بين كسورية وطويلة الأجل قد لوحظ في أزواج من الجينات وعوامل النسخ في شبكات تنظيم الجينات ، فإن الارتباط المتبادل لم يكن هو نفسه بالنسبة لجميع الأزواج.
يوضح الرسمان
3c (الخميرة) و
3 d (Escherichia coli) الارتباط المتبادل بين أزواج الجينات و FT.
استخدم العلماء هذه الرسوم البيانية لقياس الانتروبيا المعلوماتية ، ونتيجة لذلك ، المحتوى المعلوماتي لشبكة تنظيم الجينات لأنواع مختلفة من الخلايا للتحليل الكمي ومواصفات شبكات تنظيم الجينات ، وكانت مؤشرات الانتروبي: 4.18 - الخميرة ، 5.29 - E. القولونية. وهذا يشير إلى أن شبكة تعبير الجينات في خميرة الخباز أكبر بكثير وتُظهر ديناميات أكثر تعقيدًا من شبكة تعبير الجينات في الإشريكية القولونية.
والآن الشيء الأكثر إثارة للاهتمام هو إنشاء نموذج رياضي. لقد اختار العلماء نسختين من النموذج: مجموعة ماندلبروت والمجموعة في شكل أشجار المويجة دياديك.
باستخدام المؤشرات التي تم الحصول عليها مسبقًا من معامل Hölder في الطيف متعدد العوامل ، وجد العلماء أنه لا يمكن نمذجة سوى 0.04 من جميع أزواج الجينات في شبكة تنظيم الجينات لخميرة الخباز باستخدام مجموعة Mandelbrot. وفي E. coli ، لا يمكن نمذجة زوج واحد بهذه الطريقة.
إذا أخذنا في الاعتبار تلك الأزواج التي كانت قادرة على المحاكاة ، فهناك تناقض كبير في البيانات بين النموذج والملاحظات التجريبية. وكخلاصة ، فإن طريقة النمذجة الناتجة عن مجموعة Mandelbrot غير مناسبة.
الصورة رقم 4يتم عرض نتائج استخدام النموذج على أساس مجموعة Mandelbrot في الرسوم البيانية أعلاه. ألمع هو
4C ، حيث يمكننا أن نرى كم تتباعد البيانات.
وقارن العلماء أيضًا بين التعددية المرصودة للاعتمادية المتبادلة في شبكة تنظيم الجينات والنموذج متعدد الفصائل للشلالات العشوائية على الأشجار المويضية.
قرر الباحثون التحقق مما إذا كان نموذج لوغاريتمي من السلسلة W مناسبًا لتمثيل أزواج الجينات FT في شبكات تنظيم الجينات. استنادا إلى الطيف التجريبي وطيف التفرد ، تم حساب المعلمات من هذا النموذج. بعد ذلك ، تم إجراء حسابات لمناطق تقاطع الأطياف متعددة المحسوبة والتجريبية ، والتي أصبحت النسبة المعيار الرئيسي لقبول أو رفض هذا النموذج الرياضي متعدد العوامل.
الصورة رقم 5كما يتضح من الرسوم البيانية أعلاه ، والتي توضح الأطياف المتعددة التجريبية المحاكية والتجريبية ، يرتبط هذا النموذج تقريبًا تمامًا ببيانات الملاحظات والحسابات التي تم إجراؤها مسبقًا.
للتعرف أكثر تفصيلاً على الفروق الدقيقة في الدراسة ، أوصي بأن تنظر في تقرير مجموعة الأبحاث على
هذا الرابط .
خاتمةهذه الدراسة ، نظرًا لمعظمها نظريًا ، لها إمكانات كبيرة للاستخدام العملي ، لأنها ساعدت في تصميم نموذج رياضي لتنظيم التعبير الجيني - وهي واحدة من أهم العمليات في أي كائن حي. من الصعب فهم العمليات المعقدة ، بغض النظر عن مدى غرابة الأمر. لتسهيل المهمة ، من الضروري تقسيم العملية إلى مكونات ، ووضع "خرائطهم" ، واتباع المسار المطلوب ، مع الإشارة إلى جميع الميزات والخصائص المهمة. النمذجة الرياضية ، مثلها مثل أي شيء آخر ، شيء عظيم بالنسبة لهذا. بعد دراسة النموذج الرياضي لكائن أو عملية ، يمكننا فهم ما نتعامل معه قبل متابعة دراسة الكائن الفعلي أو العملية الفعلية.
أكدت هذه الدراسة مرة أخرى أن الفيزياء والكيمياء لا تحكم فقط العالم ، ولكن الرياضيات بعيدة عن المركز الأخير في أوليمبوس العلوم.
شكرًا لك على اهتمامك ، ابقَ فضوليًا ولديك أسبوع عمل رائعًا يا شباب.
شكرا لك على البقاء معنا. هل تحب مقالاتنا؟ تريد أن ترى المزيد من المواد المثيرة للاهتمام؟ ادعمنا عن طريق تقديم طلب أو التوصية به لأصدقائك ،
خصم 30٪ لمستخدمي Habr على تناظرية فريدة من خوادم الدخول التي اخترعناها لك: الحقيقة الكاملة حول VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1 جيجابت في الثانية من 20 $ أو كيفية تقسيم الخادم؟ (تتوفر خيارات مع RAID1 و RAID10 ، ما يصل إلى 24 مركزًا وما يصل إلى 40 جيجابايت من ذاكرة DDR4).
VPS (KVM) E5-2650 v4 (6 مراكز) 10GB DDR4 240GB SSD بسرعة 1 جيجابت في الثانية حتى 1 يناير مجانًا إذا تم الدفع لمدة ستة أشهر ، يمكنك طلب
هنا .
ديل R730xd 2 مرات أرخص؟ لدينا فقط
2 x Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD بسرعة 1 جيجابت في الثانية 100 TV من 249 دولارًا في هولندا والولايات المتحدة الأمريكية! اقرأ عن
كيفية بناء البنية التحتية فئة باستخدام خوادم V4 R730xd E5-2650d تكلف 9000 يورو عن بنس واحد؟