Kota dan Big Data mereka

Apa yang dibicarakan "data besar" kota? Bagaimana cara mempresentasikannya dengan jelas dan - yang lebih penting - bagaimana membuat kehidupan warga lebih baik dengan bantuan mereka?

Kami membicarakan hal ini dengan Andrei Karmatsky , CEO Urbica . Perusahaan mengkhususkan diri dalam visualisasi data perkotaan. Di antara proyek-proyeknya adalah desain ulang peta untuk MAPS.ME, visualisasi interaktif statistik perjalanan untuk Velobike dan visualisasi untuk meluncurkan sistem transportasi darat Magistral.


Lalu lintas sepeda antar daerah di pusat kota Moskow. Sumber Gambar - Medium Urbiki Blog



Dalam banyak proyeknya, Urbica melacak pergerakan orang di dalam kota. Jenis data apa yang Anda gunakan?

Kami tidak mengumpulkan data sendiri. Untuk setiap proyek, kami menggunakan data pelanggan atau mengatur koleksi mereka (misalnya, studi lapangan dan observasi jalan untuk validasi data).

Untuk visualisasi perjalanan ke Yandex.Taxi, kami menggunakan data tentang transfer taksi, untuk "Velobike" kami menggunakan data anonim tentang pergerakan pengguna layanan, untuk perencanaan transportasi jaringan rute transportasi darat Magistral, data tentang pergerakan penumpang di kendaraan, data operator seluler, data telemetri dari lalu lintas kendaraan (semua bus, troli, dan trem dilengkapi dengan sensor GLONASS).

Secara alami, data yang dikirimkan kepada kami sudah dikumpulkan dan tidak melanggar undang-undang tentang data pribadi.


Peta interaktif tinggal di urbica.co/bikes

Kisah kami dengan Velobike dimulai dengan visualisasi pergerakan sepeda di akhir musim untuk berdiri di Moscow Urban Forum. Visualisasi ini juga digunakan untuk proyek khusus "Poster" online.

Setelah memvisualisasikan data, kami menemukan banyak hal menarik: kami dengan jelas menunjukkan bagaimana skenario penggunaan sepeda sewaan pada tingkat yang berbeda, pada waktu yang berbeda dalam sehari, di berbagai wilayah kota berbeda. Sederhananya, visualisasi data (hingga saat ini semua analisis dilakukan di Velobike adalah di Excel) memungkinkan untuk melihat perbedaan antara stasiun penyewaan di pusat kota, dan, misalnya, di dekat taman Bitsevsky - ini adalah skenario yang sama sekali berbeda untuk menggunakan sepeda, dan sebagai hasilnya , berbagai pola permintaan.

Di antara pengamatan menarik dalam data, kami melihat masalah yang dapat diselesaikan dengan bantuan analitik. Permintaan di stasiun penyewaan sepeda tidak merata. Ini berarti bahwa Anda dapat datang ke stasiun dan tidak menemukan sepeda gratis atau tidak menemukan ruang kosong untuk memarkir sepeda yang sudah disewa. Velobike menyelesaikan masalah ini dengan armada kecil truk yang menyeimbangkan kembali sistem sewa antara 450 stasiun. Kami memutuskan untuk mengembangkan sistem prediksi permintaan dan menerapkan sistem ini dalam proses pengiriman pengemudi untuk meningkatkan layanan penyewaan kota dan mengoptimalkan biaya perawatan.

Bagaimana cara kerja sistem prediksi untuk operator Velobike? Metode apa yang digunakan di dalamnya untuk perhitungan?

Untuk membuat model untuk memprediksi permintaan sepeda, kami menggunakan statistik beban stasiun (berapa banyak sepeda tersedia) untuk semua musim sebelumnya, mengklasifikasikan kabupaten kota dengan tanda-tanda perubahan dalam kepadatan populasi dan pekerjaan pada hari yang berbeda dalam seminggu dan waktu, dengan mempertimbangkan topografi (itu sangat mempengaruhi keseimbangan keberangkatan) Kedatangan pengendara sepeda ke stasiun). Model prediktif menggunakan metode XGBoost dan memberikan nilai prediksi beban stasiun (permintaan potensial) selama satu jam ke depan - selama interval waktu inilah pengemudi dapat tiba di stasiun dan mengambil atau membawa sepeda.

Untuk berkomunikasi dengan sistem, driver harus menggunakan chatbot di Telegram. Apakah Anda harus mengubah cara Anda berkomunikasi karena kunci?

Kami berencana untuk memperkenalkan chatbot untuk driver sistem musim panas ini agar tidak melibatkan operator dalam proses ini, karena model dalam banyak kasus tidak memerlukan partisipasi manusia. Sayangnya, karena penyumbatan musim semi ini, bot obrolan tidak diperkenalkan.

Data urban apa lagi yang masuk akal untuk dijalankan melalui algoritma yang sama? Di mana itu akan paling bermanfaat?

Model khusus ini, tampaknya, hanya dapat diterapkan ke stasiun penyewaan sepeda, tetapi ada banyak tugas menarik di kota di mana analisis data dapat membantu. Sebagai contoh, kami menemukan hal menarik untuk mengidentifikasi rute transportasi darat yang tidak optimal dan membuat jaringan rute yang lebih efisien.


Antarmuka Pengiriman Umum

Urbica adalah salah satu peserta pameran di AI Conference:
“Kami akan menunjukkan alat dan teknologi untuk memvisualisasikan sejumlah besar data yang telah kami kembangkan dan gunakan di perusahaan kami. Ini akan menarik bagi perusahaan yang memiliki tugas analisis visual dari sejumlah besar informasi. "

Mari kita bicara tentang komponen desain pekerjaan Anda. Kecenderungan apa yang ada di bidang visualisasi data? Desain apa yang terlihat jelas ketinggalan jaman?

Pertanyaannya mungkin bukan tentang desain, melainkan tentang kenyamanan dan konten informasi. Antarmuka analitik, di mana visualisasi diperlukan, terutama menyelesaikan masalah yang diterapkan, dan tujuan utama desain antarmuka dengan set data yang besar adalah untuk menciptakan alat yang nyaman untuk menyelesaikan masalah.

Terlibat dalam visualisasi data, sangat mudah untuk melupakan tugas asli dan terbawa oleh proses visualisasi itu sendiri. Banyak proyek yang baik dengan data kota harus diambil sebagai seni data, ini adalah jalur yang berbeda dan tujuan visualisasi berbeda.

Evaluasi pekerjaan rekan: proyek keren apa di daerah Anda baru-baru ini dikeluarkan?

Kami sangat menyukai karya rekan-rekan dari tim visualisasi Uber. Mereka menciptakan alat visualisasi data mereka sendiri Kepler.GL , membuatnya dapat diakses oleh semua pengguna dan menerbitkan kodenya dalam open-source.


Membuat peta interaktif Gulag memakan waktu dua tahun. Lihat gulagmap.ru

Di antara semua proyek Anda, baik secara tematis maupun jumlah waktu yang dihabiskan, proyek dengan peta GULAG interaktif menonjol. Apa perbedaan antara proses mengerjakannya?

Pekerjaan untuk Museum Negeri Sejarah Gulag untuk membuat peta interaktif kamp sangat penting bagi kami. Pengguna akhir kartu ini atau pengunjung museum (kartu ini akan disajikan dalam eksposisi yang diperbarui pada bulan Desember) melihat kartu tersebut dan hanya melihat slider sementara dan statistik tentang jumlah tahanan yang berubah selama bertahun-tahun. Ini adalah lapisan paling atas dari proyek. Untuk membuat antarmuka ini, perlu untuk mengumpulkan sejumlah besar data yang sampai saat itu hanya ada di atas kertas. Bersama-sama dengan departemen ilmiah museum, kami mengembangkan basis data khusus dan alat pengumpulan data untuk mentransfer bit informasi dari arsip ke peta. Proyek ini juga penting secara sosial - dengan cara ini kita dapat menarik perhatian pada sejarah negara kita. Anda perlu tahu tentang hal-hal buruk seperti Gulag, mereka tidak bisa dilupakan.

Perubahan apa yang telah dialami proyek dari versi pertama ke final?

Antarmuka peta itu sendiri dan gaya, mungkin, sedikit berubah. Kami menciptakan prototipe dan mengembangkan antarmuka pengguna dalam iterasi yang berurutan. Tetapi konten internal proyek sangat berubah - versi pertama tidak menyiratkan sistem untuk mengisi data ke dalam database. Dalam perjalanan proyek, kami belajar dengan museum, mempelajari kebutuhan dan peluang baru untuk meningkatkan "pengisian" kartu.

Anda telah mengembangkan komponen Anda sendiri untuk peta ini, React Map GL. Mengapa lebih baik daripada solusi yang sudah jadi?

Kami aktif menggunakan teknologi dari Mapbox, ini memberikan yang terbaik, menurut pendapat saya, alat untuk pengembang proyek kartografi. Pada saat yang sama, kami menggunakan React.js di frontend. Kami memeriksa solusi peta Mapbox yang ada di React.js dan menyadari bahwa kami membutuhkan komponen kami sendiri.

Tentang hal yang sama terjadi dengan proyek memvisualisasikan data dari studi aglomerasi perkotaan: kami melihat bahwa solusi siap pakai yang ada tidak sesuai dengan kami dan mengembangkan server ubin vektor kami sendiri, yang akan kami tunjukkan pada Konferensi AI .

Teknologi apa yang paling sering Anda gunakan dalam pekerjaan Anda?

Seperti yang sudah saya katakan, untuk pengembangan front-end adalah React / Redux, untuk backend - Node.js / Rust / Python, untuk analisis data - Pyhton, untuk penyimpanan data dan geoprocessing - PostgreSQL / PostGIS. Mungkin tidak ada teknologi super-eksotis di sini.

Apa yang paling penting bagi Anda dalam pekerjaan Anda? Apa tantangan global yang Anda coba selesaikan?

Yang paling penting adalah membawa nilai dan melihat hasil pekerjaan Anda di ruang kota sekitarnya: museum, persewaan sepeda, atau angkutan umum. Gagasan dasar untuk menciptakan "Urbiki" tetap tidak berubah - kami membuat antarmuka di mana array data yang kompleks menjadi mudah dipahami dan dipahami.

Source: https://habr.com/ru/post/id428223/


All Articles