في الآونة الأخيرة ، نشأت حاجة لحل مشكلة الرياضيات الكلاسيكية. إحصائيات.
يتم إجراء اختبار لتأثير دفع معين على مجموعة من الأشخاص. من الضروري تقييم التأثير. بالطبع ، يمكنك القيام بذلك باستخدام نهج احتمالي.
لكن التحدث مع رجال الأعمال حول الفرضيات الفارغة والقيمة p غير مجدية تمامًا ويؤدي إلى نتائج عكسية.
كيف يمكن القيام بذلك ، اعتبارًا من فبراير 2019 ، بأقصى سرعة ممكنة مع جهاز كمبيوتر محمول "متوسط اليد"؟ ملاحظة مجردة ، لا الصيغ.
إنه استمرار للمنشورات السابقة .
بيان المشكلة
هناك مجموعتان متطابقتان إحصائياً من المستخدمين (A و B). المجموعة ب تتأثر. هل يؤدي هذا التأثير إلى تغيير في متوسط قيمة المؤشر المقاس؟
الخيار الأكثر شعبية هو حساب المعايير الإحصائية واستخلاص النتائج. تعجبني مثال "الأساليب الإحصائية الكلاسيكية: اختبار مربع كاي" . في هذه الحالة ، لا يهم كيف يتم ذلك ، بمساعدة العروض الخاصة. برامج ، إكسل ، R أو أي شيء آخر.
ومع ذلك ، يمكن أن تكون موثوقية النتائج مشكوك فيها للغاية للأسباب التالية:
- في الواقع ، حصيرة. قلة من الناس يفهمون الإحصاءات من البداية إلى النهاية. يجب عليك دائمًا مراعاة الشروط التي يمكن بموجبها تطبيق طريقة أو أخرى.
- كقاعدة عامة ، يعتمد استخدام الأدوات وتفسير النتائج على مبدأ الحساب الفردي واعتماد قرار "إشارة المرور". كلما كانت الأسئلة أقل ، كان ذلك أفضل لجميع المشاركين في العملية.
نقد قيمة p
الكثير من المواد ، روابط إلى أكثرها إثارة من تلك الموجودة:
ما الذي يمكن عمله؟
الآن كل شخص لديه جهاز كمبيوتر في متناول اليد ، وبالتالي فإن طريقة مونت كارلو يحفظ الوضع. من حسابات القيمة p ، ننتقل إلى حساب فواصل الثقة للفرق في المتوسط.
هناك العديد من الكتب والمواد ، ولكن باختصار (إعادة التشكيل والتركيب) يتم تقديمه بشكل مضغوط جدًا في تقرير Jake Vanderplas - "إحصائيات للمتسللين" - PyCon 2016 . العرض نفسه.
أحد الأعمال الأولية حول هذا الموضوع ، بما في ذلك مقترحات لتصور الرسوم البيانية ، كتبه عالم الرياضيات المشهور للعصر السوفيتي ، مارتن غاردنر: فواصل الثقة بدلاً من قيم P: التقدير بدلاً من اختبار الفرضيات. MJ Gardner and DG Altman، Br Med J (Clin Res Ed). 1986 15 مارس ؛ 292 (6522): 746-750 .
كيفية استخدام R لهذه المهمة؟
حتى لا نفعل كل شيء بأيدينا على المستوى الأدنى ، دعونا ننظر إلى الوضع الحالي للنظام البيئي. منذ وقت ليس ببعيد ، تم dabestr
حزمة dabestr
مريحة للغاية : تم نقل تحليل البيانات باستخدام تقدير Bootstrap-Coupled إلى R.
يتم وصف مبادئ حساب وتحليل النتائج المستخدمة في dabestr
في شكل dabestr
الغش هنا: إحصائيات تقدير بيتا تحليل بياناتك مع أحجام تأثير .
مثال على دفتر ملاحظات "اللمس": --- title: "A/B bootstrap" output: html_notebook: self_contained: TRUE editor_options: chunk_output_type: inline ---
library(tidyverse) library(magrittr) library(tictoc) library(glue) library(dabestr)
المحاكاة
إنشاء توزيع غير طبيعي من مدة العمليات.
my_rlnorm <- function(n, mean, sd){ # . : https://en.wikipedia.org/wiki/Log-normal_distribution#Arithmetic_moments location <- log(mean^2 / sqrt(sd^2 + mean^2)) shape <- sqrt(log(1 + (sd^2 / mean^2))) print(paste("location:", location)) print(paste("shape:", shape)) rlnorm(n, location, shape) } # N (A = Control) A_control <- my_rlnorm(n = 10^3, mean = 500, sd = 150) %T>% {print(glue("mean = {mean(.)}; sd = {sd(.)}"))} # N (B = Test) B_test <- my_rlnorm(n = 10^3, mean = 525, sd = 150) %T>% {print(glue("mean = {mean(.)}; sd = {sd(.)}"))}
نقوم بجمع البيانات في النموذج اللازم للتحليل باستخدام أدوات dabestr
وإجراء التحليل.
df <- tibble(Control = A_control, Test = B_test) %>% gather(key = "group", value = "value") tic("bootstrapping") two_group_unpaired <- df %>% dabest(group, value, # The idx below passes "Control" as the control group, # and "Test" as the test group. The mean difference # will be computed as mean(Test) - mean(Control). idx = c("Control", "Test"), paired = FALSE, reps = 5000 ) toc()
دعنا نلقي نظرة على النتائج
two_group_unpaired plot(two_group_unpaired)
=================================================== ====
النتيجة كـ CI
DABEST (Data Analysis with Bootstrap Estimation) v0.2.0 ======================================================= Unpaired mean difference of Test (n=1000) minus Control (n=1000) 223 [95CI 209; 236] 5000 bootstrap resamples. All confidence intervals are bias-corrected and accelerated.
و الصور

مفهومة للغاية ومريحة للتحدث مع رجال الأعمال. كانت جميع الحسابات لـ "فنجان قهوة".
المنشور السابق - "علوم البيانات" القوات الخاصة "في المنزل" .