Hallo!
Am 10. November (morgen!) Wird in Moskau im Oktyabr Cinema Center die große Konferenz zum
Sberbank Data Science Day stattfinden, auf der die Gewinner des SDSJ 2018 ausgezeichnet werden, Reden einer großen Anzahl internationaler und russischer Experten auf dem Gebiet der Datenwissenschaft, ein Abschnitt über ML und den Einsatz künstlicher Intelligenz in der Wissenschaft und Geschäft. Und viel interessanter!
Sie können die Live-Übertragung
hier sehen . Unter katom und
auf der Website das Programm. Wir beschreiben auch, wie die Gewinner der Sberbank Data Science Journey bewertet wurden.
Das Programm
Die Konferenz ist in mehrere Themenblöcke unterteilt. Hier ist der Zeitplan:
Haupthalle11:00 - 11:30. Die Eröffnung der Konferenz.
11:30 - 12:30. Podiumsdiskussion „Datenanalyse und Technologien für künstliche Intelligenz in der digitalen Wirtschaft“
12:30 - 13:15. "Biologisch bedingte Methoden und Architekturen im Deep Learning." Sergey Bartunov, Deep Mind
13:15 - 14:00. "Conversational Agents als intelligenter digitaler Begleiter, um menschliche Emotionen zu verstehen und ihre Emotionen auszudrücken." Soo-Young Lee, KAIST
15:00 - 15:45. "Skalierbares automatisches maschinelles Lernen." Andrey Spiridonov, H2O
15:45 - 16:30. Podiumsdiskussion „Trendinnovation: Verwendung von DS / AI und Verbesserung des Kundenerlebnisses“
17:15 - 18:00 Feierliche Verleihung der Gewinner der Wettbewerbe Sberbank Data Science Journey und
Classic AI (Wettbewerb in Versifikation mit künstlicher Intelligenz)
Halle "Wissenschaft"12:30 - 13:45 .DS / AI-Technologie: AutoML
13:45 - 14:45. DS / AI-Technologie: Computer Vision
14:45 - 15:45 .DS / AI-Technologie: Verarbeitung natürlicher Sprache (NLP)
15:45 - 16:30 .DS / AI-Technologie: Reinforcement Learning
16:30 - 17:15 .DS / AI-Technologien: Sprachanalyse
Halle "Business" (Halle 1)12:30 - 13:45. DS / AI-Anwendung im Bank- und Finanzwesen
13:45 - 15:00. Der Einsatz von DS / AI in der Medizin und Bioinformatik
15:00 - 16:15 Uhr Anwendung von DS / AI im Banken- und Finanzsektor
16:15 - 17:15 .Brainwriting: Schaffung einer Plattform für KI-Forschung
Business Hall (Halle 2)12:30 - 14:45. Die Verwendung von DS / AI im Einzelhandel
14:45 - 16:30. Industrielle DS / AI-Anwendungen
16:30 - 17:15. DS / AI-Anwendung in Medien und Telekommunikation
Gemeindehaus12:30 - 13:15. Präsentation der Poster "Poster Session Lightning Talk"
13:15 - 15:00. Präsentation offener Projekte im Bereich DS / AI "AI Open Projects"
15:00 - 15:45. Klassische KI-Wettbewerbsentscheidung
15:45 - 17:15. Analyse des Wettbewerbs der Sberbank Data Science Journey
Gewinner der Sberbank Data Science Journey
In diesem Jahr haben wir vorgeschlagen, Probleme mithilfe der AutoML-Technologie zu lösen. Bis Ende November 3 haben die Teilnehmer ihre Entscheidungen hochgeladen und in den nächsten 12 Stunden die besten aus ihren Entscheidungen ausgewählt. Jetzt liegt die Wahl bei der Jury. Auf der Konferenz werden wir die Gewinner der Sberbank Data Science Journey belohnen.
Die Teilnehmer erhielten vorgefertigte Datensätze von der Sberbank. Alle 24 am Wettbewerb beteiligten Datensätze wurden von verschiedenen Abteilungen gesammelt: der Einzelhandelseinheit, der Risikoeinheit und der Technologieeinheit. Alle von ihnen wurden speziell geschult und entpersönlicht. Grundlage waren Informationen wie:
- Genehmigter Limit-Anteil
- Kartenlieferzeit
- Verschiedene Arten der Wertung
- Kartenangebot Feedback
- Reaktion auf andere Produktangebote
- ATM-Pannen
- Informationen zur Geldabhebung am Geldautomaten
- Kontensalden und andere Informationen
Um die Entscheidungen zu bewerten, wurden Gruppen von Datensätzen ausgewählt: Aktivieren (offen für Teilnehmer), öffentlich (vor den Teilnehmern verborgen, aber Sie können das Ergebnis während des Wettbewerbs sehen), privat (festgelegt, auf dem die Ergebnisse des Wettbewerbs zusammengefasst sind).
In jedem solchen Satz gibt es drei Regressionsprobleme und fünf binäre Klassifizierungsprobleme. Die Lösungen arbeiteten mit Datensätzen verschiedener Größen: von 1 MB und 300 Zeilen bis zu 1 GB und 1 Mio. Zeilen. Vor dem Start des Wettbewerbs hat die Jury Datensätze vorbereitet, das Testsystem hat sie bereits im automatischen Modus überprüft, und
jetzt können Sie die Ergebnisse auf der Website sehen (unter Berücksichtigung der mit Intrigen verbundenen Einschränkungen).
Entscheidungen wurden im Format von Archiven mit einem Code getroffen. Die Teilnehmer mussten einen Algorithmus erstellen, der den gesamten Zyklus der automatischen Lösung des Problems des maschinellen Lernens implementiert, Daten als Eingabe empfängt und eine fertige Antwort an der Ausgabe zurückgibt.
Die Entscheidungen der Teilnehmer mussten in die vorgegebenen Einschränkungen passen:
- Ressourcen verfügbar
- Die Lösung hat keinen Zugriff auf Internetressourcen
- Die maximale Größe eines gepackten und entpackten Archivs mit einer Lösung: 1 GB
- Das Archiv wird in ein Dateisystem entpackt, das sich im Direktzugriffsspeicher (Ramfs) befindet und für die Schreiblösung verfügbar ist
- Der Rest des Containers ist schreibgeschützt
- CSV mit Datensatz überschreitet 3 GB nicht
- Einschränkungen sind erforderlich, um faire Vergleiche zu erzielen, indem die Teilnehmer unter gleichen technischen Bedingungen platziert werden.
Das Bewertungssystem in diesem Wettbewerb lautet wie folgt:
- Für jede Aufgabe (Datensatz) wird die für die Aufgabe spezifische Metrik (RMSE für die Regression, ROC-AUC für die binäre Klassifizierung) im Testteil der Stichprobe berücksichtigt.
- Für jede Aufgabe (Datensatz) werden die Metriken der Teilnehmer gemäß dem folgenden Schema in eine gemeinsame Skala übersetzt. Für die beste metrische Lösung (unter allen gesendeten und erfolgreich getesteten Lösungen) wird 1 Punkt angegeben, die Basislinienlösung wird auf 0 Punkte geschätzt. Teilnehmer, die sich in der Metrik zwischen der besten und der Basislösung befinden, erhalten eine proportionale Anzahl von Punkten zwischen 0 und 1. Entscheidungen über die Qualität des unteren Bereichs der Basislinie werden auf 0 Punkte geschätzt. Wenn die beste Lösung und die Basisentscheidung gleich sind, erhalten alle Teilnehmer 0 Punkte. Wenn die Lösung des Teilnehmers einen Fehler bei der Aufgabe anzeigt oder das Zeitlimit nicht überschreitet, erhält er 0 Punkte für diese Aufgabe.
- Das Endergebnis jedes Teilnehmers wird als Summe der Ergebnisse für jede Aufgabe nach der Umstellung auf eine gemeinsame Skala betrachtet. In der allgemeinen Rangliste werden die Teilnehmer nach dem Endergebnis geordnet.
Die Ergebnisse des Wettbewerbs finden Sie
hier .
Neben der Hauptklassifikation kämpften die Teilnehmer um einen Preis in der Nominierung „Beste öffentliche Entscheidung“. Während des gesamten Wettbewerbs veröffentlichten sie ihre Ansätze zur Lösung des AutoML-Problems auf GitHub, und die Gewinner wurden anhand der Anzahl der GItHub-Sterne ermittelt.
Die Konferenz wird einen separaten Bereich für SDSJ'18 haben, in dem die Gewinner über ihre Entscheidungen sprechen und alle Fragen beantworten.
Hinterlassen Sie erneut einen Link zur
Online-Sendung der Konferenz, damit alle Interessierten den Sberbank Data Science Day sehen können.