المدن وبياناتها الضخمة

ما الذي تتحدث عنه "البيانات الضخمة" للمدينة؟ كيف نقدمها بوضوح - والأهم من ذلك - كيفية تحسين حياة المواطنين بمساعدتهم؟

تحدثنا عن هذا مع أندريه كارماتسكي ، الرئيس التنفيذي لشركة Urbica . تتخصص الشركة في تصور البيانات الحضرية. من بين مشاريعها إعادة تصميم الخريطة لـ MAPS.ME ، تصور تفاعلي لإحصاءات السفر لـ Velobike وتصور لإطلاق نظام النقل البري Magistral.


حركة الدراجات الهوائية بين المناطق في وسط موسكو. مصدر الصورة - مدونة Urbiki المتوسطة



في العديد من مشاريعها ، تتابع Urbica تحركات الناس داخل المدينة. ما أنواع البيانات التي تستخدمها؟

نحن لا نجمع البيانات بمفردنا. لكل مشروع ، نستخدم بيانات العملاء أو ننظم مجموعاتهم (على سبيل المثال ، الدراسات الميدانية وملاحظات الشوارع للتحقق من صحة البيانات).

لتصور الرحلات إلى Yandex.Taxi ، استخدمنا بيانات حول سيارات الأجرة ، بالنسبة لـ "Velobike" ، استخدمنا بيانات مجهولة المصدر حول تحركات مستخدمي الخدمة ، لتخطيط النقل لشبكة طرق النقل البري Magistral ، بيانات عن تحركات الركاب على المركبات ، بيانات مشغلي شبكات الجوال ، بيانات القياس عن بعد لحركة المركبات (جميع الحافلات وحافلات الترام والترام مجهزة بأجهزة استشعار GLONASS).

بطبيعة الحال ، فإن البيانات المرسلة إلينا مجمعة بالفعل ولا تنتهك التشريعات المتعلقة بالبيانات الشخصية.


تعيش الخريطة التفاعلية على موقع urbica.co/bikes

بدأت قصتنا مع Velobike مع تصور حركة الدراجات في نهاية الموسم لموقف في منتدى موسكو الحضري. كما تم استخدام هذه التصورات لمشروع "الملصقات" الخاص عبر الإنترنت.

بعد تصور البيانات ، وجدنا الكثير من الأشياء المثيرة للاهتمام: أظهرنا بوضوح كيف تختلف سيناريوهات استخدام تأجير الدراجات بمعدلات مختلفة ، في أوقات مختلفة من اليوم ، في مناطق مختلفة من المدينة. ببساطة ، تصور البيانات (حتى هذه اللحظة كان كل التحليل في Velobike كان في Excel) جعل من الممكن رؤية الفرق بين محطة الإيجار في وسط المدينة ، وعلى سبيل المثال ، بالقرب من متنزه Bitsevsky - هذه سيناريوهات مختلفة تمامًا لاستخدام دراجة ، ونتيجة لذلك وأنماط الطلب المختلفة.

من بين الملاحظات المثيرة للاهتمام في البيانات ، رأينا مشكلة يمكن حلها بمساعدة التحليلات. الطلب في محطة تأجير الدراجات متفاوت. هذا يعني أنه يمكنك القدوم إلى المحطة وعدم العثور على دراجات مجانية أو عدم العثور على مساحة مجانية لإيقاف دراجة مستأجرة بالفعل. Velobike يحل هذه المشكلة مع أسطول صغير من الشاحنات التي تعيد توازن نظام الإيجار بين 450 محطة. قررنا تطوير نظام التنبؤ بالطلب وتنفيذ هذا النظام في عملية إرسال السائق من أجل تحسين خدمة تأجير المدينة وتحسين تكاليف الصيانة.

كيف يعمل النظام التنبئي لمرسلي Velobike؟ ما هي الأساليب المستخدمة في الحسابات؟

لإنشاء نموذج للتنبؤ بالطلب على الدراجات ، استخدمنا إحصائيات حمل المحطة (عدد الدراجات المتوفرة) لجميع المواسم السابقة ، وصنفنا مناطق المدينة من خلال علامات التغيرات في الكثافة السكانية والوظائف في أيام مختلفة من الأسبوع والوقت من اليوم ، وأخذت في الاعتبار التضاريس (إنها تؤثر بشكل كبير على توازن المغادرين وصول راكبي الدراجات إلى المحطة). يستخدم النموذج التنبئي طريقة XGBoost ويعطي القيمة المتوقعة لعبء عمل المحطة (الطلب المحتمل) لمدة ساعة قادمة - خلال هذه الفترة الزمنية يمكن للسائق الوصول إلى المحطة واستلام أو إحضار الدراجات.

للتواصل مع النظام ، كان على السائقين استخدام برنامج الدردشة الآلي في Telegram. هل اضطررت إلى تغيير الطريقة التي تتواصل بها بسبب الأقفال؟

لقد خططنا لتقديم برنامج chatbot لمشغلات النظام هذا الصيف حتى لا تُشرك المرسل في هذه العملية ، حيث أن النموذج في معظم الحالات لا يتطلب مشاركة بشرية. لسوء الحظ ، بسبب انسداد هذا الربيع ، لم يتم إدخال روبوت الدردشة.

ما هي البيانات الحضرية الأخرى التي من المنطقي تشغيلها من خلال خوارزميات مماثلة؟ أين ستكون أكثر فائدة؟

يبدو أن هذا النموذج الخاص لا يمكن تطبيقه إلا على محطات تأجير الدراجات ، ولكن هناك الكثير من المهام المثيرة للاهتمام في المدينة حيث يمكن لتحليلات البيانات أن تساعد. على سبيل المثال ، نجد أنه من المثير للاهتمام تحديد طرق النقل البري دون المستوى الأمثل وإنشاء شبكة طرق أكثر كفاءة.


واجهة الإرسال العامة

أوربيكا أحد العارضين في مؤتمر الذكاء الاصطناعي:
"سنعرض الأدوات والتقنيات لتصور كميات كبيرة من البيانات التي قمنا بتطويرها واستخدامها في شركتنا. سيكون مثيرا للاهتمام للشركات التي لديها مهمة التحليل البصري لكميات كبيرة من المعلومات ".

لنتحدث عن مكون التصميم لعملك. ما هي الاتجاهات الموجودة في مجال تصور البيانات؟ ما التصميم الذي يبدو عفا عليه الزمن بشكل واضح؟

ربما لا يكون السؤال عن التصميم ، بل عن الراحة ومحتوى المعلومات. تحل الواجهات التحليلية ، حيث يلزم التصور ، في المقام الأول المشكلات التطبيقية ، والهدف الرئيسي من تصميم الواجهات بمجموعات كبيرة من البيانات هو إنشاء أدوات ملائمة لحل المشكلة.

من خلال المشاركة في تصور البيانات ، من السهل جدًا نسيان المهمة الأصلية والابتعاد عن عملية التصور نفسها. يجب اعتبار العديد من المشاريع الجيدة مع بيانات المدينة بمثابة فن بيانات ، وهذا مسار مختلف وهدف التصور مختلف.

تقييم عمل الزملاء: ما هي المشاريع الرائعة التي تم طرحها مؤخرًا في منطقتك؟

نحن نحب حقًا عمل الزملاء من فريق التصور في أوبر. قاموا بإنشاء أداة تصور البيانات الخاصة بهم Kepler.GL ، وجعلوها متاحة لجميع المستخدمين ونشروا كودها في مصدر مفتوح.


استغرق رسم خريطة تفاعلية لجولاج عامين. انظر gulagmap.ru

من بين جميع مشاريعك من حيث الموضوع ومقدار الوقت الذي تقضيه ، يبرز مشروع مع خريطة GULAG تفاعلية. ما الفرق بين عملية العمل عليها؟

إن العمل الذي يقوم به متحف الدولة لتاريخ غولاغ لإنشاء خريطة تفاعلية للمخيمات مهم للغاية بالنسبة لنا. ينظر المستخدم النهائي لهذه البطاقة أو زائر المتحف (سيتم تقديم هذه البطاقة في معرض محدث في ديسمبر) إلى البطاقة ولا يرى سوى منزلق مؤقت وإحصائيات عن عدد السجناء المتغير على مر السنين. هذه هي الطبقة العليا من المشروع. لإنشاء هذه الواجهة ، كان من الضروري جمع كمية كبيرة من البيانات التي كانت موجودة حتى تلك اللحظة على الورق فقط. بالتعاون مع القسم العلمي في المتحف ، قمنا بتطوير قاعدة بيانات خاصة وأدوات لجمع البيانات لنقل أجزاء من المعلومات من الأرشيف إلى الخريطة. هذا المشروع مهم أيضًا اجتماعيًا - وبهذه الطريقة يمكننا لفت الانتباه إلى تاريخ بلادنا. تحتاج إلى معرفة أشياء رهيبة مثل Gulag ، لا يمكن نسيانها.

ما هي التغييرات التي خضع لها المشروع من الإصدار الأول إلى النهائي؟

ربما تغيرت واجهة الخريطة نفسها والأسلوب قليلاً. لقد أنشأنا نموذجًا أوليًا وطورنا واجهات المستخدم في التكرارات المتتالية. لكن المحتوى الداخلي للمشروع تغير بشكل كبير - لم يتضمن الإصدار الأول نظامًا لملء البيانات في قاعدة البيانات. في سياق المشروع ، درسنا مع المتحف ، وتعلمنا الاحتياجات والفرص الجديدة لتحسين "ملء" البطاقة.

لقد طورت مكونك الخاص لهذه الخريطة ، React Map GL. لماذا هي أفضل من الحلول الجاهزة؟

نحن نستخدم بنشاط تقنيات من Mapbox ، فهي توفر ، في رأيي ، أفضل الأدوات لمطوري مشاريع رسم الخرائط. في نفس الوقت ، نستخدم React.js على الواجهة الأمامية. لقد قمنا بفحص حلول خرائط Mapbox الموجودة في React.js وأدركنا أننا بحاجة إلى المكون الخاص بنا.

حدث نفس الشيء تقريبًا مع مشروع تصور بيانات البحث حول التجمعات الحضرية: رأينا أن الحلول الجاهزة الحالية لم تناسبنا وطورنا خادم البلاط المتجه الخاص بنا ، والذي سنعرضه في مؤتمر AI .

ما التقنيات التي تستخدمها غالبًا في عملك؟

كما قلت بالفعل ، لتطوير الواجهة الأمامية هو React / Redux ، للواجهة الخلفية - Node.js / Rust / Python ، لتحليلات البيانات - Pyhton ، لتخزين البيانات والمعالجة الجيولوجية - PostgreSQL / PostGIS. ربما لا توجد تقنيات فائقة الغرابة هنا.

ما هو الأهم بالنسبة لك في عملك؟ ما التحدي العالمي الذي تحاول حله؟

الشيء الأكثر أهمية هو أن تحمل القيمة وترى نتائج عملك في المساحة الحضرية المحيطة: متحف ، أو استئجار دراجة أو وسائل النقل العام. ظلت الفكرة الأساسية لإنشاء "Urbiki" دون تغيير - فنحن نصمم واجهات تصبح فيها صفائف البيانات المعقدة مفهومة وسهلة الفهم.

Source: https://habr.com/ru/post/ar428223/


All Articles