تحية!
في سبتمبر من هذا العام (2019) ، تم انتخاب حاكم سانت بطرسبرغ. جميع بيانات التصويت متاحة للجمهور على الموقع الإلكتروني للجنة الانتخابات ، ولن نكسر أي شيء ، ولكن ببساطة تصور المعلومات من هذا الموقع
www.st-petersburg.vybory.izbirkom.ru بالشكل الذي نحتاج إليه ، وسنقوم بإجراء تحليل بسيط للغاية وتحديد بعض أنماط "السحر".
عادةً لمثل هذه المهام ، أستخدم Google Colab. هذه خدمة تتيح لك تشغيل Jupyter Notebooks ، والوصول إلى GPU (NVidia Tesla K80) مجانًا ، وسوف تسرع بشكل كبير في تحليل البيانات والمعالجة الإضافية. كنت بحاجة إلى بعض الأعمال التحضيرية قبل الاستيراد.
%%time !apt update !apt upgrade !apt install gdal-bin python-gdal python3-gdal
واردات أخرى.
import requests from bs4 import BeautifulSoup import numpy as np import pandas as pd import matplotlib.pyplot as plt import geopandas as gpd import xlrd
وصف المكتبات المستخدمة
- طلبات - وحدة لطلب للحصول على اتصال إلى موقع
- BeautifulSoup - وحدة لتحليل وثائق HTML و XML. يسمح لك بالوصول مباشرة إلى محتوى أي علامات في html
- numpy - وحدة رياضية مع مجموعة أساسية وضرورية من الوظائف الرياضية
- الباندا - مكتبة تحليل البيانات
- matplotlib.pyplot - مجموعة من أساليب البناء
- geopandas - وحدة لبناء خريطة الانتخابات
- xlrd - وحدة لقراءة ملفات الجدول
لقد حان الوقت لجمع البيانات نفسها ، parsim. اهتمت لجنة الانتخابات بوقتنا وقدمت تقارير في الجداول ، فهي مريحة.
لذلك ، هذا ما نوقش. يتم جمع البيانات في Google Colab بذكاء ، ولكن ليس كثيرًا.
قبل إنشاء العديد من الرسوم البيانية والخرائط ، من الجيد أن يكون لدينا فكرة عما نسميه "مجموعة البيانات".
تحليل بيانات لجنة الانتخابات
في مدينة سان بطرسبرغ ، هناك 30 لجنة إقليمية ؛ بالنسبة لهم ، في العمود الحادي والثلاثين ، نشير إلى مراكز الاقتراع الرقمية.

كل لجنة إقليمية لديها عدة عشرات من اللجان الانتخابية (لجان الانتخابات السابقة).

الشيء الرئيسي الذي يهمنا هو الظهور في كل مركز اقتراع ، وما نوع التبعيات التي يمكننا ملاحظتها. سأبني على ما يلي:
- اعتماد الإقبال وعدد محطات الاقتراع ؛
- اعتماد نسبة الأصوات للمرشحين على المشاركة ؛
- اعتماد الإقبال على عدد الناخبين في الدائرة الانتخابية.
من جدول البيانات العارية ، من الصعب للغاية تتبع كيفية سير الانتخابات واستخلاص بعض الاستنتاجات ، وبالتالي فإن الرسوم البيانية هي طريقنا للخروج.
دعونا نبني ما توصلنا إليه.
اعتماد الإقبال وعدد محطات الاقتراع
اعتماد نسبة الأصوات للمرشحين على المشاركة
اعتماد الإقبال على عدد الناخبين في الدائرة الانتخابية
تعتبر الإنشاءات مقبولة تمامًا ، ولكن أثناء العمل تبين أن متوسط 400 شخص في الموقع والنسبة المئوية لـ Beglov يتراوح من 50 إلى 70 شخصًا ، ولكن يوجد موقعان إقبالان أكبر من 1200 شخص ونسبة 90 + -0.2. ومن المثير للاهتمام أن هذا حدث في هذه المناطق. هل عمل بعض المحرضين الرائعين؟ أو فقط قاد 10 باصات وأجبر على التصويت؟ بطريقة أو بأخرى ، نحن متحمسون ، يتم إجراء تحقيق صغير من هذا القبيل. ولكن لا يزال يتعين علينا رسم البطاقات. دعنا نستمر.
التمثيل البصري والعمل مع geopandas

لقد رسموا المناطق الإدارية للمدينة ووقعوها ، يبدو مألوفًا ، يبدو مثل بيتر ، لكن نيفا لا تزال غير كافية.
عدد الناخبين
مظهر

استنتاج
يمكنك الاستمتاع بالبيانات لفترة طويلة ، واستخدامها في مجالات مختلفة ، وبالطبع الحصول على بعض الفوائد ، لأنها موجودة. أدوات تصوير الموقع الجغرافي البسيطة والمتطورة يمكن أن تفعل أشياء عظيمة. اكتب عن نجاحك في التعليقات!