استخدام القوة الحاسوبية لـ R لاختبار فرضية تكافؤ الوسائل

في الآونة الأخيرة ، نشأت حاجة لحل مشكلة الرياضيات الكلاسيكية. إحصائيات.
يتم إجراء اختبار لتأثير دفع معين على مجموعة من الأشخاص. من الضروري تقييم التأثير. بالطبع ، يمكنك القيام بذلك باستخدام نهج احتمالي.


لكن التحدث مع رجال الأعمال حول الفرضيات الفارغة والقيمة p غير مجدية تمامًا ويؤدي إلى نتائج عكسية.


كيف يمكن القيام بذلك ، اعتبارًا من فبراير 2019 ، بأقصى سرعة ممكنة مع جهاز كمبيوتر محمول "متوسط ​​اليد"؟ ملاحظة مجردة ، لا الصيغ.


إنه استمرار للمنشورات السابقة .


بيان المشكلة


هناك مجموعتان متطابقتان إحصائياً من المستخدمين (A و B). المجموعة ب تتأثر. هل يؤدي هذا التأثير إلى تغيير في متوسط ​​قيمة المؤشر المقاس؟


الخيار الأكثر شعبية هو حساب المعايير الإحصائية واستخلاص النتائج. تعجبني مثال "الأساليب الإحصائية الكلاسيكية: اختبار مربع كاي" . في هذه الحالة ، لا يهم كيف يتم ذلك ، بمساعدة العروض الخاصة. برامج ، إكسل ، R أو أي شيء آخر.


ومع ذلك ، يمكن أن تكون موثوقية النتائج مشكوك فيها للغاية للأسباب التالية:


  1. في الواقع ، حصيرة. قلة من الناس يفهمون الإحصاءات من البداية إلى النهاية. يجب عليك دائمًا مراعاة الشروط التي يمكن بموجبها تطبيق طريقة أو أخرى.
  2. كقاعدة عامة ، يعتمد استخدام الأدوات وتفسير النتائج على مبدأ الحساب الفردي واعتماد قرار "إشارة المرور". كلما كانت الأسئلة أقل ، كان ذلك أفضل لجميع المشاركين في العملية.

نقد قيمة p


الكثير من المواد ، روابط إلى أكثرها إثارة من تلك الموجودة:



ما الذي يمكن عمله؟


الآن كل شخص لديه جهاز كمبيوتر في متناول اليد ، وبالتالي فإن طريقة مونت كارلو يحفظ الوضع. من حسابات القيمة p ، ننتقل إلى حساب فواصل الثقة للفرق في المتوسط.


هناك العديد من الكتب والمواد ، ولكن باختصار (إعادة التشكيل والتركيب) يتم تقديمه بشكل مضغوط جدًا في تقرير Jake Vanderplas - "إحصائيات للمتسللين" - PyCon 2016 . العرض نفسه.


أحد الأعمال الأولية حول هذا الموضوع ، بما في ذلك مقترحات لتصور الرسوم البيانية ، كتبه عالم الرياضيات المشهور للعصر السوفيتي ، مارتن غاردنر: فواصل الثقة بدلاً من قيم P: التقدير بدلاً من اختبار الفرضيات. MJ Gardner and DG Altman، Br Med J (Clin Res Ed). 1986 15 مارس ؛ 292 (6522): 746-750 .


كيفية استخدام R لهذه المهمة؟


حتى لا نفعل كل شيء بأيدينا على المستوى الأدنى ، دعونا ننظر إلى الوضع الحالي للنظام البيئي. منذ وقت ليس ببعيد ، تم dabestr حزمة dabestr مريحة للغاية : تم نقل تحليل البيانات باستخدام تقدير Bootstrap-Coupled إلى R.


يتم وصف مبادئ حساب وتحليل النتائج المستخدمة في dabestr في شكل dabestr الغش هنا: إحصائيات تقدير بيتا تحليل بياناتك مع أحجام تأثير .


مثال على دفتر ملاحظات "اللمس":
 --- title: "A/B   bootstrap" output: html_notebook: self_contained: TRUE editor_options: chunk_output_type: inline --- 

 library(tidyverse) library(magrittr) library(tictoc) library(glue) library(dabestr) 

المحاكاة


إنشاء توزيع غير طبيعي من مدة العمليات.


 my_rlnorm <- function(n, mean, sd){ #  . : https://en.wikipedia.org/wiki/Log-normal_distribution#Arithmetic_moments location <- log(mean^2 / sqrt(sd^2 + mean^2)) shape <- sqrt(log(1 + (sd^2 / mean^2))) print(paste("location:", location)) print(paste("shape:", shape)) rlnorm(n, location, shape) } # N   (A = Control) A_control <- my_rlnorm(n = 10^3, mean = 500, sd = 150) %T>% {print(glue("mean = {mean(.)}; sd = {sd(.)}"))} # N   (B = Test) B_test <- my_rlnorm(n = 10^3, mean = 525, sd = 150) %T>% {print(glue("mean = {mean(.)}; sd = {sd(.)}"))} 

نقوم بجمع البيانات في النموذج اللازم للتحليل باستخدام أدوات dabestr وإجراء التحليل.


 df <- tibble(Control = A_control, Test = B_test) %>% gather(key = "group", value = "value") tic("bootstrapping") two_group_unpaired <- df %>% dabest(group, value, # The idx below passes "Control" as the control group, # and "Test" as the test group. The mean difference # will be computed as mean(Test) - mean(Control). idx = c("Control", "Test"), paired = FALSE, reps = 5000 ) toc() 

دعنا نلقي نظرة على النتائج


 two_group_unpaired plot(two_group_unpaired) 

=================================================== ====


النتيجة كـ CI


 DABEST (Data Analysis with Bootstrap Estimation) v0.2.0 ======================================================= Unpaired mean difference of Test (n=1000) minus Control (n=1000) 223 [95CI 209; 236] 5000 bootstrap resamples. All confidence intervals are bias-corrected and accelerated. 

و الصور
الصورة
مفهومة للغاية ومريحة للتحدث مع رجال الأعمال. كانت جميع الحسابات لـ "فنجان قهوة".


المنشور السابق - "علوم البيانات" القوات الخاصة "في المنزل" .

Source: https://habr.com/ru/post/ar441192/


All Articles