Hai
Pada bulan September tahun ini (2019), pemilihan Gubernur St. Petersburg diadakan. Semua data pemungutan suara tersedia untuk umum di situs web komisi pemilihan umum, kami tidak akan memecah apa pun, tetapi cukup memvisualisasikan informasi dari situs web ini
www.st-petersburg.vybory.izbirkom.ru dalam bentuk yang kami butuhkan, kami akan melakukan analisis yang sangat sederhana dan mengidentifikasi beberapa Pola "ajaib".
Biasanya untuk tugas seperti itu saya menggunakan Google Colab. Ini adalah layanan yang memungkinkan Anda untuk menjalankan Notebook Jupyter, dan memiliki akses ke GPU (NVidia Tesla K80) secara gratis, ini akan secara signifikan mempercepat penguraian data dan pemrosesan lebih lanjut. Saya perlu beberapa pekerjaan persiapan sebelum mengimpor.
%%time !apt update !apt upgrade !apt install gdal-bin python-gdal python3-gdal
Impor lebih lanjut.
import requests from bs4 import BeautifulSoup import numpy as np import pandas as pd import matplotlib.pyplot as plt import geopandas as gpd import xlrd
Deskripsi perpustakaan yang digunakan
- permintaan - modul untuk permintaan untuk terhubung ke situs
- BeautifulSoup - modul untuk parsing dokumen html dan xml; memungkinkan Anda untuk mengakses langsung konten dari tag apa pun di html
- numpy - modul matematika dengan seperangkat fungsi matematika dasar dan perlu
- panda - perpustakaan analisis data
- matplotlib.pyplot - modul-set metode konstruksi
- geopanda - modul untuk membangun peta pemilihan
- xlrd - modul untuk membaca file tabel
Waktunya telah tiba untuk mengumpulkan data itu sendiri, parsim. Panitia pemilihan menjaga waktu kami dan menyediakan pelaporan di tabel, itu mudah.
Jadi, inilah yang dibahas. Data di Google Colab dikumpulkan dengan cerdas, tetapi tidak terlalu banyak.
Sebelum membuat berbagai grafik dan peta, ada baiknya kita memiliki gagasan tentang apa yang kita sebut "dataset".
Analisis data komisi pemilu
Di kota St. Petersburg ada 30 komisi wilayah, untuk mereka, di kolom ke-31, kami merujuk tempat pemungutan suara digital.

Setiap komisi teritorial memiliki beberapa lus PEC (komisi pemilihan daerah).

Hal utama yang menarik bagi kami adalah penampilan di setiap TPS, dan ketergantungan seperti apa yang bisa kami amati. Saya akan membangun yang berikut ini:
- ketergantungan jumlah pemilih dan jumlah tempat pemungutan suara;
- ketergantungan dari persentase suara untuk kandidat pada jumlah pemilih;
- Ketergantungan jumlah pemilih pada pemilih di kantor polisi.
Dari tabel data telanjang, cukup sulit untuk melacak bagaimana pemilihan berlangsung dan menarik beberapa kesimpulan, sehingga grafik adalah jalan keluar kami.
Mari kita membangun apa yang kita hasilkan.
Ketergantungan jumlah pemilih dan jumlah TPS
Ketergantungan persentase suara untuk kandidat pada jumlah suara- "Hijau" - suara untuk Amosov
Ketergantungan jumlah pemilih pada pemilih di kantor polisi
Konstruksi cukup dapat ditoleransi, tetapi dalam pekerjaannya ternyata rata-rata 400 orang di situs dan persentase untuk Beglov adalah 50 hingga 70, tetapi ada dua situs dengan jumlah pemilih> 1200 orang dan persentase 90 + -0,2. Sangat menarik bahwa ini terjadi di daerah ini. Apakah beberapa agitator yang hebat bekerja? Atau hanya mengendarai 10 orang bus dan dipaksa memilih? Dengan satu atau lain cara, kami senang, penyelidikan kecil seperti itu sedang dilakukan. Tetapi kita masih harus menggambar kartu. Mari kita lanjutkan.
Representasi visual dan bekerja dengan geopanda

Mereka melukis distrik administratif kota dan menandatangani mereka, terlihat akrab, sepertinya Peter, tetapi Neva masih belum cukup.
Jumlah pemilih
Jumlah suara

Kesimpulan
Anda dapat bersenang-senang dengan data untuk waktu yang lama, menggunakannya di berbagai bidang dan, tentu saja, mendapatkan manfaat, karena ini ada. Alat visualisasi geolokasi sederhana dan canggih dapat melakukan hal-hal besar. Tulis tentang kesuksesan Anda dalam komentar!