المواطنة عن طريق الحمض النووي ، أو يشتري اليهود الاختبارات الجينية

إن تحليل الانتماء السكاني بواسطة الحمض النووي ، في تجربتنا ، يثير ثلاثة أسئلة كبيرة بين الجمهور: هل يمكن ربط الجينات والمجموعات العرقية معًا ، وكيف يتم تحليل الأصل من وجهة نظر فنية ، وما إذا كانت الاختبارات الجينية يمكن "تحديد اليهود". لسبب ما ، فإن مسألة الهوية اليهودية بالتحديد مع الحمض النووي هي التي تثير كلاً من أولئك الذين لديهم أدلة لا يمكن إنكارها على الانتماء إلى الأشخاص الذين اختارهم الله والذين لا يأكلون ماتساه ولا يقرأون التوراة.

في مادة Genotek الجديدة على Geektimes ، سنحاول الإجابة على كل شيء بالترتيب. ونعم ، نحن أيضًا نعرّف اليهود.



الأجناس الملقبة بالمجموعات السكانية في علم الأحياء والطب وعلم الوراثة


لدى البشرية عادة سيئة تتمثل في تبرير العنف بالتفوق "الفطري" لعرق على آخر - وهذا هو السبب في أن علماء الأحياء الحديثين يتعاملون مع قضية الاختلافات الجينية بين السكان بحذر أكثر صرامة. نوقش (عدم) وجود الحدود البيولوجية بين المجموعات العرقية والإثنية بشدة خلال القرن العشرين ، ولكن لم يتم التوصل إلى إجماع نهائي حول هذه القضية ( 1 ).

كان من المأمول أن يؤدي تسلسل الجينوم البشري إلى الجمع بين الجميع. الجينوم ، الذي يُقرأ "من" و "إلى" ، سيبين أن الحدود بين المجموعات ذات طبيعة اجتماعية ، والجينات هي نفسها للجميع. وتبين بشكل مختلف: لقد أحيت دراسة متأنية لشفرة النوكليوتيدات البشرية وزادت الاهتمام بالاختلافات البيولوجية بين السكان العرقيين والعرقيين. وجدت نفس الجينات ، بشكل عام ، متغيرات أليلية مختلفة قليلاً مرتبطة بخطر الإصابة بالأمراض ( 2 ) ، استقلاب الدواء ( 3 ) ، استجابة الجسم للظروف البيئية ( 4 ) ، وقد تم العثور على هذه المتغيرات في مجموعات سكانية مختلفة بترددات مختلفة.

تم إيقاف البحث عن جينات "هندية" أو "أفريقية" غير موجودة ، لكن البحث في مجال علم الوراثة الطبية والسكان لا يزال يوازي بين الخصائص البيولوجية والعرقية للمشاركين. نوقش بنشاط استخدام مصطلحي "العرق" و "العرق" في مثل هذه الأعمال (وغالبًا ما يتم إدانته). كانت هناك محاولات لإدخال قواعد تجبر الباحثين على تبرير الحاجة إلى استخدام فئات "زلقة" وتوضيح المقصود بالضبط بمصطلحات محددة. في فبراير من العام الماضي ، نشرت مجلة Science ، إحدى أكثر المجلات العلمية احترامًا ، مقالة غامضة ( 5 ) ، تقترح التخلي تمامًا عن استخدام مصطلح "العرق" في البحث الجيني ، واستبداله بـ "أصل" أكثر صحة وحيادية - "أصل" .

ولكن حتى في ظروف عدم اليقين من حيث المصطلحات ، لا تزال الإنسانية مقسمة إلى مجموعات سكانية: على وجه الخصوص ، لإجراء التجارب السريرية الصحيحة للأدوية وتقييم خطر الأمراض. على سبيل المثال ، ترتبط ثلاثة متغيرات أليلية من جين NOD2 - R702W و G908R و 1007 fs - بزيادة خطر الإصابة بمرض كرون في الأمريكيين الأوروبيين ( 6 ، 7 ) ، ومع ذلك ، لا يرتبط أي من هذه المتغيرات بمرض كرون في اليابانية ( 8 ). من المعروف أن أليلات جين CCR5 تؤثر على معدل تطور نقص المناعة لدى المرضى المصابين بفيروس نقص المناعة البشرية ( 9 ): من بينها ، تم العثور على خيار يبطئ تطور المرض في الأمريكيين من أصل أوروبي ، ولكنه يسرع من تطوره في الأمريكيين الأفارقة ( 10 ). وجد الآسيويون ارتباطًا بين الأشكال المتعددة لجين البروتين p53 ، الذي ينظم استجابة الإجهاد ويقمع تطور الأورام ، ومتوسط ​​درجات حرارة الشتاء في موائل السكان - التكيف الوراثي للصقيع ( 11 ). وإذا تم في الماضي استخدام المعلومات التي قدمها المشاركون أنفسهم فقط لتقسيم العينة إلى مجموعات عرقية ، في عصر ما بعد الجينوم يتم استكمالها وتنقيحها بشكل متزايد بتقييم وراثي لأصل الشخص.

الاختلاف الجيني بين السكان


في الحياة اليومية ، نقسم الناس إلى مجموعات حسب المظهر أو لغة التواصل. يشبه معظم الدنماركيين بعضهم البعض أكثر مما يشبه كل منهم الإيطالي ( هنا هو تصور رائع مع صور متوسط ​​من جنسيات مختلفة). الدنماركيون والإيطاليون أقرب إلى بعضهم البعض من بعضهم البعض - إلى سكان أفريقيا جنوب الصحراء الكبرى: الأنماط الجغرافية تتجمع حسب النمط الجغرافي. توزيع الأنماط الجينية له بنية مماثلة: أعضاء مجموعة محلية ، كقاعدة عامة ، لديهم روابط عائلية أقرب من سكان المناطق النائية ، والسكان الذين يعيشون في منطقة واحدة أقرب من أولئك الذين يفصلون بين موائلهم بحواجز جغرافية (على سبيل المثال ، سلاسل الجبال أو المياه صفيف).

علاوة على ذلك ، فإن التنوع الجيني لسكان البشر أقل من العديد من الأنواع البيولوجية. ويفسر ذلك حقيقة أن البشرية هي نوع صغير من الشباب: لم يكن لدى المجموعات الفردية وقت كبير نسبيًا لتراكم الاختلافات. يختلف شخصان يتم اختيارهما عشوائيًا عن بعضهما عن طريق كل من ~ 1000 نوكليوتيدات ، في حين أن الشمبانزي لا يتزامنان مرة واحدة في 500 حرفًا تقريبًا. ومع ذلك ، بشكل عام ، هناك حوالي 3 ملايين "نقطة اختلاف" محتملة في الجينوم البشري. معظم هذه التناقضات ، التي تسمى تعدد أشكال النوكليوتيدات المفردة (SNPs) ، محايدة أو شبه محايدة ، ولكن بعضها مسؤول عن الاختلافات المظهرية بين الأشخاص.

إن توزيع الأشكال المتعددة المحايدة (بما أنه ليس لها معنى بيولوجي ، فهي لا تخضع للاختيار التطوري الاتجاهي ، فهي تحملها رياح الهجرات) في عدد سكان العالم يعكس التاريخ الديموغرافي لأنواعنا. تشير الأدلة الجينية والأثرية إلى أن حجم السكان البشري قد نما بشكل ملحوظ على مدى 100،000 سنة الماضية. استقر الناس خارج أفريقيا ، واستعمار بقية العالم. أثرت عملية إعادة التوطين على التوزيع الجغرافي للأليل بطريقتين: أولاً ، "التأثير المؤسس" المتأثر - في عدد السكان المهاجرين ، كقاعدة عامة ، تم تمثيل جزء فقط من المتغيرات الجينية من مجموعة متنوعة تمامًا من مجموعة الأجداد. وثانياً ، حدث ما يسمى بـ "العبور التعبيري" ، أي تشكلت أزواج بشكل رئيسي داخل مجموعتهم ، مما حد من توزيع الأشكال المتعددة الحالية والناشئة بين الأفراد الذين يسكنون مناطق جغرافية مختلفة. أدت هذه العمليات إلى التراكم التدريجي للاختلافات الجينية.

في سياق المجموعات السكانية ، بدأت دراسة المؤشرات الجينومية في السبعينيات والثمانينيات ، وفي التسعينات ، بدأ استخدامها لتحديد سكان شخص معين. لقد أثبت الباحثون مرارًا وتكرارًا أن تعدد الأشكال الجيني يمكن أن يعزل المجموعات السكانية بنجاح ويحدد الانتماء الجماعي للفرد. ثم تبين أن الأشخاص الذين يعيشون في نفس القارة عادة ما يكونون أقرب لبعضهم البعض وراثيا من الناس من قارات مختلفة. في البداية ، في مثل هذه الدراسات ، كانت المعلومات حول مكان الولادة والعرق والمجموعة العرقية معروفة منذ البداية واستخدمت مع البيانات الجينية ؛ إذا تم توزيع الموضوعات بشكل أعمى ، حصريًا على أساس الخصائص الوراثية ، فإن التوافق بين الأصل الجغرافي والعرق والبنية السكانية كان أقل وضوحًا. وكما أظهرت دراسات أخرى ، فإن النجاح يعتمد على الواسمات الجينية المستخدمة وعددها (الأكثر أفضل) ، والاختيار الصحيح للمجموعات المرجعية وعوامل أخرى ( 12 ).

بحلول عام 2004 ، في الولايات المتحدة ، تم استخدام التعريف الجيني للسكان ليس فقط في البحوث الطبية الحيوية ، ولكن أيضًا في التحقيقات الجنائية: تحتوي هذه المقالة من الطبيعة على قصة مثيرة حول كيف قرر ضباط الشرطة ، الذين يائسون للعثور على مجرم ، أمر اختبار الحمض النووي من شركة تجارية ، لون جلد المشتبه به وفتح العلبة. وصلت الاقتراحات لتحليل الأصل الجيني بنجاح إلى موجة الاهتمام العام بالناس في ماضيهم. "هوس الجذور" ، ما يسمى بهذه الهواية في مقال في الزمن ، مخصص لـ "هوس أمريكا الأخير" - بحث الأنساب.

يتم استخدام الأساليب الجينومية بنشاط من قبل المتخصصين الذين يدرسون أصل وتطور الشعوب. على سبيل المثال ، في عام 2013 ، استخدم فريق دولي من الباحثين التحليل الجيني لدحض فرضية أصل اليهود الأشكناز من الخزر ( 13 ). مجموعة البيانات الجينومية التي يستخدمها المؤلفون موجودة في المجال العام: فهي تحتوي على أكثر من 100 من سكان العالم. نقترح محاكاة دراسة صغيرة معنا: لتحديد مكان عملاء Genotek في هذه العينة ، وفي نفس الوقت لفهم التفاصيل التقنية لتحديد السكان.

الغرض من البحث


التعرف على عملاء Genotek بين المجموعات المرجعية. اكتشف ما إذا كان هناك ممثلين عن اليهود الأشكناز في عينتنا. شرح مبادئ وطرق تحليل سكان الفرد.

أهداف البحث


معالجة بيانات التنميط الجيني لـ 722 شخصًا باستخدام برنامج ADMIXTURE باستخدام مجموعة البيانات من Behar et al. ، 2013 كعينة تدريبية.

المواد والأساليب


استخدم العمل الأصلي لـ Behar et al. ، 2013 ، بيانات من 1774 شخصًا: من بينهم ممثلو 88 من السكان غير اليهود (من شبه الجزيرة العربية وآسيا الوسطى وشرق آسيا وأوروبا والشرق الأوسط وشمال أفريقيا وسيبيريا وجنوب آسيا وشبه الفرعية أفريقيا الصحراوية) و 18 من السكان اليهود. يحتاج المؤلفون إلى مجموعة بيانات واسعة النطاق لتحديد مكان الأشكناز بدقة في سياق سكان العالم: كانت المهمة تقديم جميع المناطق الجغرافية الثلاث حيث يمكن أن تأتي هذه المجموعة افتراضيًا - أوروبا والشرق الأوسط وخزر خاجانات. أكد المؤلفون على الفرق بين نهج أخذ العينات ، الذي يمثل السكان الأوروبيين والشرق أوسطيين الحديثين - أحفاد السكان الأصليين ، والعينات المقابلة لخزر كاجانات ، التي توقفت عن الوجود منذ حوالي 1000 عام. الصيد هو أنه ليس من بين السكان الحاليين هو الوريث المباشر لخاقانات. اختار المؤلفون سكان جنوب القوقاز (الأبخاز والأرمن والأذربيجانيين والجورجيين) وشمال القوقاز (الأديغ والبلكار والشيشان والكاباردين والأوسيتيين والعديد من الجنسيات الأخرى) وشوفاش والتتار كممثلين عصريين محتملين للخزر.
أضفنا عينات من 722 شخصًا من مناطق مختلفة من روسيا إلى مجموعة البيانات.

بالنسبة للتحليل الإحصائي ، استخدمنا برنامج ADMIXTURE ، الذي يسمح لنا بتقدير الأصل الأكثر احتمالية للفرد بناءً على البيانات المتعلقة بالأنماط الجينية. بالإضافة إلى ذلك ، استخدم مؤلفو المقالة قيد المناقشة طرقًا إحصائية أخرى أعطت إجابة مماثلة على السؤال المطروح. سنركز على ADMIXTURE ، نظرًا لأن هذه الخوارزمية هي التي تسمح لنا بتقدير النسبة المئوية لمساهمة الأجداد في الجينوم المدروس.

يستخدم ADMIXTURE طرق مونت كارلو في سلاسل ماركوف (سلسلة ماركوف مونت كارلو ، MCMC). هنا رابط لمقالة كتبها مؤلفو الخوارزمية لأولئك الذين يريدون أن يفهموا بمزيد من التفصيل الجانب الرياضي للعملية.

دعونا نرى كيف يعمل ADMIXTURE على سبيل المثال من العينات والسكان من مجموعتنا


في المجموع ، لدينا 2496 عينة / فرد ، ينتمي كل منها إلى واحد من 106 من السكان الحديثين. نقترح أن السكان الحديثين ينحدرون على الأرجح من عدد صغير نسبيًا من مجموعات الأجداد. "مجموعات الأجداد" في هذا التحليل هي بعض مجموعات الجينوم القديمة ، توحدها مبدأ التشابه الجيني. يسمح ADMIXTURE بوضع افتراضات بشكل تعسفي حول عدد هذه العناقيد في العينة ، واختيار الرقم الأمثل الذي يصف التوزيع الحقيقي للبيانات الجينومية بشكل صحيح.

بعد تلقي معلومات حول الأنماط الجينية والعدد التقديري لمجموعات "الأجداد" (K) ، يقوم ADMIXTURE ببناء نموذج لتقدير مساهمة كل من مجموعات "الأجداد" في كل عينة. عند تفسير البيانات ، فإن كلا من التركيب الكمي للجينوم (النسبة المئوية للمجموعات) والكيفي مهمان - وجودهما أو غيابهما في جينومات محددة. بناءً على هذه البيانات ، يمكن للمرء أن يضع افتراضات حول العمليات التطورية في المجتمع ، على وجه الخصوص ، حول وجود أو عدم وجود "جذور" مشتركة في مجموعات السكان. ومع ذلك ، ستكون الاستنتاجات مشروعة إذا كان النموذج الذي أنشأناه جيدًا: تم تحديد القيمة المثلى لـ K.

نختار القيمة المثلى لـ K


كيفية تحديد عدد السكان "الأجداد" الأكثر تطابقًا مع ما هو حقيقي لعينة معينة؟ تجريبيا!

يعد ADMIXTURE برنامجًا ذكيًا: بناء نموذج للهيكل الجيني للسكان بناءً على بيانات حول الأنماط الجينية للأفراد (تقييم مساهمة كل من مجموعات الجينوم القديمة في كل جينوم عينة) لعدد معين من K ، لا تنسى إجراء مقارنة مع الواقع في النهاية. تحقق من مدى وصف المدخلات بواسطة النموذج المُنشأ. مقياس المقارنة هو "الخطأ" - قيمة تصف عدم التوافق بين النموذج والبيانات الحقيقية. وكلما كان الخطأ أكبر ، كان الافتراض الصحيح لعدد مجموعات الأجداد أسوأ.

كيفية اختيار القيمة المثلى لـ K؟ نبدأ خوارزمية ADMIXTURE في هذه العينة ، ونستبدل القيم المختلفة لـ K ، ونحصل على كل خطأ قيمة الخطأ الخاصة به. نرسم اعتماد حجم الخطأ على K. هنا هو الرسم البياني الذي حصل عليه مؤلفو المقالة:



تكون القيمة المثلى لـ K عند الحد الأدنى من الوظيفة. إذا لم يتم العثور على الحد الأدنى على الرسم البياني (الوظيفة تتزايد باستمرار أو تتناقص) ، فسيتعين عليك بناء نماذج باختيار Ks جديدة حتى تتمكن من العثور على النموذج الصحيح.

حتى مع اختيار K الأمثل ، تعتمد موثوقية نتائج التحليل على صحة العينة:

1. لا ينبغي أن يكون الأفراد على صلة ببعضهم البعض.
2. يجب توزيع الأشكال المتعددة المفردة للنيوكليوتيدات (SNPs) المستخدمة في التنميط الجيني بالتساوي على الجينوم بكثافة عالية بما فيه الكفاية.
3. يجب أن تكون الأليلات SNP في ارتباط توازن ، أي أن احتمال وجود أليل معين في فرد معين يجب أن يعتمد فقط على تواتر هذا الأليل في السكان ، وليس على الأليلات الأخرى في الجينوم.

كما يتضح من الرسم البياني ، فإن K الأمثل لهذه العينة كان 10 مجموعات "أسلاف".

النتائج


يتم تصور نتائج التحليل بواسطة ADMIXTURE مثل هذا (في الشكل فقط جزء من البيانات مرئي):



كل مجموعة لها لونها الخاص ، وتختلف المجموعات (أو لا تختلف) في حصص العناقيد في الجينوم. هنا تكمن النسخة التفاعلية من الصورة في دراسة تفصيلية: حرك الماوس وقم بالتمرير لرؤية جميع السكان أو النظر في بعض المجموعات بمزيد من التفصيل.

بشكل عام ، ضمن "السكان" من Genotek ، من المتوقع أن تتوافق نسبة الكتلة مع خاصية نمط السكان من أصل شرق أوروبا. يبدأ المثير للاهتمام على مستوى العينات الفردية:



على الرغم من أن السكان الأقرب إلى العينة المحددة يتم تحديدها من خلال القيم العددية ، يمكن أيضًا الحصول على الكثير من المعلومات من خلال المقارنة المرئية للأنماط. نقترح أن تحدد بشكل مستقل المجموعات السكانية الأقرب لعينات من أربعة عملاء Genotek من الصورة.

الجواب
في هذه الصورة ، العينات 1 و 2 من أصل آسيوي: غلبة المجموعة الوردية نموذجية بالنسبة لليابانيين وشعب الخان في عينتنا ، والأزرق للياكوت ، والعينة الثالثة تظهر نسبة المكونات النموذجية للروس والبيلاروس والأوكرانيين والبولنديين والرابع نموذجي اشكناز يهودي.

من أصل 722 عينة ، وجدنا 9 يهود أشكنازي.

الخلاصة


الانتماء السكاني بعيد عن العامل الوحيد الذي يحدد التعريف الذاتي العرقي للشخص. ومع ذلك ، لا يزال من الممكن الكشف عن العلاقة بين الجماعات العرقية وهيكل جينوم ممثليها. يتم استخدام هذا التحليل للأغراض العلمية والطبية على حد سواء ، ولدراسة جذورهم من قبل جميع القادمين. في الوقت نفسه ، من المهم أن نفهم أن النماذج يتم تحسينها باستمرار ، وينبغي النظر في النتائج التي تم الحصول عليها للحصول على دقة أكبر بالاقتران مع البيانات الأخرى ، على سبيل المثال ، شجرة الأنساب العائلية.

لم يتم العثور على أي دليل على أصل الخزر من اشكنازي من قبل مؤلفي المقالة الأصلية. الاختبارات الجينية ، بالطبع ، "تعرف" كيفية التعرف على اليهود - ومع ذلك ، لا ينبغي للمرء أن ينسى أن "اليهود" هو ، أولاً وقبل كل شيء ، حالة ذهنية.

في المستقبل القريب ، سيتم إطلاق اختبار الحمض النووي المحدث مع نتائج موسعة في Genotek: سنرفع عدد السكان إلى المئات ، نضيف السكان اليهود. سنقوم بتحديث المعلومات الموجودة في حسابك الشخصي لكل شخص اجتاز موادنا الوراثية. إذا كنت لا تزال غير مكتوب جينيًا ، فإننا ندعوك للانضمام .

المراجع


  1. فوستر م. ، شارب ر. (2002). العرق والعرق وعلم الجينوم: التصنيفات الاجتماعية كوكلاء للتغايرية البيولوجية. Res الجينوم.
  2. كولينز FS ، McKusick VA (2001). آثار مشروع الجينوم البشري على العلوم الطبية. جاما.
  3. Nebert DW، Menon AG (2001) الجينات الدوائية ، الإثنية ، والجينات الحساسة. علم الأدوية الجيني J.
  4. أولدن ك ، جوثري ج. (2001). علم الجينوم: الآثار المترتبة على علم السموم. متات. الدقة.
  5. Yudell M. ، Roberts D. ، DeSalle R. ، Tishkoff S. (2016). أخذ العرق من علم الوراثة البشرية. العلم.
  6. Ogura ، Y. et al. (2001). طفرة في الإطار في NOD2 مرتبطة بالحساسية لمرض كرون. الطبيعة.
  7. هوغوت ، جي بي وآخرون. (2001). جمعية متغيرات NOD2 المتكررة الغنية بالليوسين مع قابلية الإصابة بمرض كرون. الطبيعة.
  8. Inoue ، N. (2002). عدم وجود متغيرات NOD2 الشائعة في المرضى اليابانيين المصابين بداء كرون. أمراض الجهاز الهضمي.
  9. مارتن ، النائب وآخرون (1998). التسارع الجيني لتطور الإيدز بواسطة متغير مروج لـ CCR5. العلم.
  10. Gonzalez، E. et al. (1999). الآثار المعدلة لفيروس العوز المناعي البشري -1 المعدلة للمرض المرتبطة بالنماذج الفردية CCR5. بروك. Natl Acad. علوم. الولايات المتحدة الأمريكية
  11. شي وهونغ وآخرون. (2009). ترتبط درجة حرارة الشتاء والأشعة فوق البنفسجية ارتباطًا وثيقًا بالتغيرات الجينية في مسار p53 الكابت للأورام في شرق آسيا. المجلة الأمريكية لعلم الوراثة البشرية.
  12. Bamshad M. ، Wooding S. ، Salisbury B. et al. (2004). تفكيك العلاقة بين علم الوراثة والعرق. Nat Rev Genet.
  13. Behar DM وآخرون. (2013). لا يوجد دليل من البيانات على نطاق الجينوم من أصل خازار لليهود الأشكناز. علم الأحياء البشرية

Source: https://habr.com/ru/post/ar402923/


All Articles