
إذا قمت بمقارنة بيانات أداتين تحليليتين على موقع الويب نفسه أو قارنت التحليلات بالتقارير والمبيعات ، فمن المحتمل أنك لاحظت أنها غير متطابقة دائمًا. في هذه المقالة ، سأشرح لماذا لا توجد بيانات في إحصاءات منصات تحليل الويب ، ومدى ضخامة هذه الخسائر.
في هذه المقالة ، سنركز على Google Analytics ، باعتبارها الخدمة التحليلية الأكثر شيوعًا ، على الرغم من أن معظم الأنظمة التحليلية المطبقة على الصفحة تواجه نفس المشكلات. تتجنب الخدمات التي تعتمد على سجلات الخادم بعض هذه المشكلات ، لكنها نادراً ما تستخدم حتى لا نغطيها في هذه المقالة.
تحليلات اختبار التكوينات في المقطر
في Distilled.net ، لدينا مورد Google Analtics قياسي يعمل من علامة HTML في Google Tag Manager. بالإضافة إلى ذلك ، على مدى العامين الماضيين ، استخدمت ثلاثة تطبيقات موازية إضافية لبرنامج Google Analytics ، المصممة لقياس الاختلافات بين التكوينات المختلفة.
يقوم اثنان من هذه التطبيقات الإضافية - أحدهما في GTM والآخر في الصفحة - بإدارة نسخ مُخزنة محليًا وأُعيدت تسميتها من ملف جافا سكريبت في Google Analytics (www.distilled.net/static/js/au3.js بدلاً من
www.google-analytics.com/ analytics.js ) لجعلها أكثر صعوبة للكشف عن مانع الإعلانات.
لقد استخدمت أيضًا وظائف JavaScript التي تمت إعادة تسميتها ("tcap" و "Buffoon" بدلاً من "ga" القياسية) وأُعيدت تسمية أجهزة التتبع ("FredTheUnblockable" و "AlbertTheImmutable") لتجنب مشكلة أجهزة التتبع المكررة (والتي يمكن أن تؤدي إلى مشاكل في كثير من الأحيان).
أخيرًا ، لدينا تكوين "DianaTheIndefatigable" ، الذي يحتوي على متتبع أعيدت تسميته ، ولكنه يستخدم الكود القياسي ويتم تنفيذه على مستوى الصفحة.

يتم عرض جميع التكوينات لدينا في الجدول أدناه:

لقد اختبرت وظائفها في مختلف المتصفحات وحاصرات الإعلانات من خلال تحليل مشاهدات الصفحة التي تظهر في أدوات مطور المتصفح:

أسباب فقدان البيانات
1. حاصرات الإعلانات
أصبحت أدوات منع الإعلانات ، بشكل أساسي في شكل امتدادات المتصفح ، أكثر شيوعًا. في البداية ، كان السبب الرئيسي لاستخدامها هو تحسين تجربة الأداء والتفاعل على المواقع التي تحتوي على قدر كبير من الإعلانات. في السنوات الأخيرة ، زاد التركيز على خصوصية البيانات ، مما ساهم أيضًا في زيادة شعبية مانع الإعلانات.
تأثير حاصرات الإعلاناتيحظر بعض مانعي الإعلانات الأنظمة الأساسية لتحليل الويب افتراضيًا ؛ وقد يتم تكوين البعض الآخر لأداء هذه الوظيفة. لقد اختبرت موقع Distiller باستخدام Adblock Plus و uBlock Origin ، وهما امتدادان لمستعرض سطح المكتب الأكثر شيوعًا لحظر الإعلانات ، لكن تجدر الإشارة إلى أن حاصرات الإعلانات تستخدم أيضًا بشكل متزايد على الهواتف الذكية.
تم الحصول على النتائج التالية (جميع الأرقام تتعلق أبريل 2018):

كما يتضح من الجدول ، فإن إعدادات GA التي تم تغييرها لا تساعد بشكل كبير في مقاومة الحاصرات.
فقد البيانات بسبب حاصرات الإعلانات: حوالي 10 ٪قد يكون استخدام حاصرات الإعلانات على مستوى 15-25 ٪ حسب المنطقة ، ولكن العديد من هذه الإعدادات هي AdBlock Plus مع الإعدادات الافتراضية ، والتي ، كما رأينا أعلاه ، لا يتم حظر التتبع.
تتراوح حصة AdBlock Plus في سوق مانع الإعلانات ما بين 50 إلى 70٪.
وفقا للتقديرات الأخيرة ، هذا الرقم هو أقرب إلى 50 ٪. لذلك ، إذا افترضنا أن أكثر من 50٪ من برامج حظر الإعلانات المثبتة تمنع التحليلات ، فسنحصل على فقد البيانات عند مستوى 10٪ تقريبًا.
2. لا تتبع الميزة في المتصفحات
هذه ميزة أخرى تحفزها حماية الخصوصية. ولكن هذه المرة لا يتعلق الأمر بالوظيفة الإضافية ، ولكن يتعلق بوظيفة المستعرضات نفسها. طلب عدم التعقب ليس مطلوبًا للمواقع والأنظمة الأساسية ، ولكن ، على سبيل المثال ، يوفر Firefox وظيفة أقوى ضمن نفس مجموعة المعلمات ، التي قررت أيضًا اختبارها.
تأثير لا تتبعتقدم معظم المتصفحات الآن خيار رسالة عدم التعقب. لقد اختبرت أحدث إصدارات لمتصفحي Firefox و Chrome لنظام التشغيل Windows 10.
مرة أخرى ، يبدو أن الإعدادات التي تم تغييرها هنا لا تساعد كثيرًا أيضًا.فقدان البيانات بسبب "عدم التعقب": <1٪أظهر الاختبار أن ميزة "حماية التعقب" فقط في متصفح Firefox Quantum تؤثر على أجهزة التتبع. يشغل Firefox 5٪ من سوق المتصفح ، ولكن لا يتم تمكين حماية التتبع بشكل افتراضي. لذلك ، لم يؤثر إطلاق هذه الوظيفة على اتجاهات حركة مرور Firefox على Distilled.net.
3. المرشحات
يمكن أن تقلل الفلاتر التي تقوم بتكوينها في نظام التحليلات عن قصد أو عن غير قصد من حجم حركة المرور المستلمة في التقارير.
على سبيل المثال ، من الواضح أن المرشح الذي يستبعد دقة شاشة معينة ، والتي قد تكون روبوتات أو حركة مرور داخلية ، سيؤدي إلى بعض التقليل من تقدير حركة المرور.
فقدان البيانات بسبب المرشحات: N / A
يصعب تقييم تأثير هذا العامل ، لأن هذا الإعداد يختلف باختلاف الموقع. لكنني أوصي بشدة بوجود عرض مكرر "رئيسي" (بدون عوامل تصفية) حتى تتمكن من رؤية فقدان المعلومات المهمة بسرعة.
4. GTM مقابل على صفحة مقابل رمز يقع بشكل غير صحيح
في السنوات الأخيرة ، أصبح برنامج إدارة العلامات من Google وسيلة شائعة بشكل متزايد لتنفيذ التحليلات بسبب مرونته وسهولة إجراء التغييرات. ومع ذلك ، لاحظت منذ فترة طويلة أن طريقة تنفيذ GA هذه يمكن أن تؤدي إلى التقليل من القيمة مقارنة بالإعداد على مستوى الصفحة.
كنت فضوليًا أيضًا بشأن ما يمكن أن يحدث إذا لم تتبع توصيات Google الخاصة بتعيين الشفرة الموجودة في الصفحة.
من خلال دمج بياناتي الخاصة مع البيانات من
موقع زميلي دوم وودمان ، الذي يستخدم امتداد دروبال التحليلي ، وكذلك GTM ، أستطيع أن أرى الفرق بين مدير العلامات والرمز الموجود بشكل غير صحيح في الصفحة (وضعت في أسفل العلامة). بعد ذلك ، قمت بمطابقة هذه البيانات مع بيانات GTM الخاصة بي لرؤية الصورة كاملة عبر جميع التكوينات الخمسة.
تأثير GTM ورمز في غير محله على الصفحة
حركة المرور كنسبة مئوية من خط الأساس (التنفيذ القياسي باستخدام Tag Manager):

النتائج الرئيسية
- عادةً ما تسجل الشفرة في الصفحة حركة مرور أكثر من GTM ؛
- عادةً ما يكون الرمز المعدل ضمن هامش الخطأ ، باستثناء رمز GTM المعدل في Internet Explorer ؛
- سيكلفك رمز التتبع الموجود في مكان غير صحيح ما يصل إلى 30٪ من عدد الزيارات مقارنةً بالكود المطبق على الصفحة بشكل صحيح ، اعتمادًا على المتصفح (!) ؛
- التكوينات المخصصة المصممة لتلقي المزيد من الحركة عن طريق تجنب حاصرات الإعلانات لا تفعل ذلك.
تجدر الإشارة أيضًا إلى أن تطبيقات المستخدم في الواقع تتلقى حركة مرور أقل من التطبيقات القياسية. في حالة الكود الموجود في الصفحة ، تكون الخسائر ضمن هامش الخطأ ، ولكن في حالة GTM ، هناك فارق بسيط آخر يمكن أن يؤثر على البيانات النهائية.
منذ أن استخدمت ملفات التعريف غير المصفاة للمقارنة ، كان هناك الكثير من البريد المزعج الروبوت في ملف التعريف الرئيسي ، والذي كان في الغالب متنكرا في شكل Internet Explorer.
اليوم ، ملف تعريفنا الرئيسي هو الأكثر إزعاجًا ، لكنه يستخدم أيضًا كالمستوى الذي تم اختياره للمقارنة ، وبالتالي فإن الفرق بين الكود الموجود في الصفحة ومدير العلامات هو في الواقع أكبر قليلاً.
فقدان بيانات GTM: 1-5 ٪
تختلف الخسائر المرتبطة بـ GTM بناءً على المتصفحات والأجهزة التي يستخدمها زائرو موقعك. على Distilled.net ، يبلغ الفرق حوالي 1.7٪ ، ويستخدم جمهورنا بشكل نشط أجهزة الكمبيوتر المكتبية ومتطور تقنيًا ، ونادراً ما يستخدم Internet Explorer. اعتمادا على العمودي ، يمكن أن تصل الخسائر إلى 5 ٪.
لقد قمت أيضًا بتفصيل حسب الجهاز:

فقد البيانات بسبب الكود الموجود على الصفحة بشكل غير صحيح: حوالي 10٪
على Teflsearch.com ، تم فقد حوالي 7.5٪ من البيانات بسبب وجود رمز غير صحيح ، مقابل GTM. بالنظر إلى أن إدارة العلامات نفسها تقلل من شأن البيانات ، فإن الخسارة الكلية يمكن أن تصل بسهولة إلى 10 ٪.
المكافأة: فقدان البيانات من القنوات
أعلاه ، درسنا المناطق التي يمكنك أن تفقد البيانات بشكل عام. ومع ذلك ، هناك عوامل أخرى تؤدي إلى بيانات غير كاملة. سننظر فيها بإيجاز. المشاكل الرئيسية هنا هي حركة المرور الداكنة والإسناد.
حركة المرور الظلامحركة المرور المظلمة هي حركة مرور مباشرة ، وهي ليست حركة مرور مباشرة.
وهذا أصبح وضع شائع بشكل متزايد.
الأسباب النموذجية لحركة المرور المظلمة:
- حملات تسويق البريد الإلكتروني غير المميزة ؛
- الحملات غير المميزة في التطبيقات (خاصة Facebook و Twitter وما إلى ذلك) ؛
- حركة العضوية المشوهة ؛
- البيانات المرسلة بسبب الأخطاء التي حدثت أثناء عملية إعداد التتبع (قد تظهر أيضًا كإحالات ذاتية) ؛
كما تجدر الإشارة إلى وجود اتجاه في اتجاه نمو حركة المرور المباشرة الحقيقية ، والتي كانت تاريخيا العضوية. على سبيل المثال ، فيما يتعلق بتحسين وظيفة الإكمال التلقائي في المتصفحات ، ومزامنة سجل البحث على أجهزة مختلفة ، وما إلى ذلك ، يبدو أن الناس "يدخلون" عنوان URL الذي كانوا يبحثون عنه سابقًا.
عزو
بشكل عام ، تعد الجلسة في Google Analytics (وعلى أي نظام أساسي آخر) بنية تعسفية إلى حد ما. قد تجد أنه من الواضح كيف ينبغي دمج مجموعة من المكالمات في جلسة واحدة أو أكثر ، ولكن في الواقع ، تعتمد هذه العملية على عدد من الافتراضات المشكوك فيها إلى حد ما. على وجه الخصوص ، تجدر الإشارة إلى أن Google Analytics تنسب عادةً حركة المرور المباشرة (بما في ذلك حركة المرور المظلمة) إلى المصدر السابق غير المباشر ، إذا كان موجودًا.
استنتاج
لقد فوجئت إلى حد ما ببعض النتائج التي تلقيتها ، لكنني متأكد من أنني لم أغطي كل شيء ، وهناك طرق أخرى لفقدان البيانات. لذلك ، يمكن مواصلة البحث في هذا المجال.
يمكن قراءة المزيد من هذه المقالات على
قناة التلغراف الخاصة بي (proroas).