
Wie unterscheidet sich die erste Konferenz von der zweiten? Bei der Vorbereitung des ersten gibt es weder die Möglichkeit, "wie zuvor zu tun", noch das Feedback des Publikums, und die Organisatoren müssen mutige Annahmen treffen. Dies bedeutet nicht, dass es schlecht ausgehen wird. Dies bedeutet jedoch, dass nach dem ersten Mal sicherlich neue Überlegungen auftauchen werden, die im zweiten helfen werden.
Letztes Jahr haben wir zum ersten Mal die SmartData-Konferenz abgehalten, und jetzt ist es zum „zweiten Mal“
soweit : Wir kündigen die
SmartData 2018 an , die
am 15. Oktober in St. Petersburg stattfinden wird .
Was erwartet Sie von der Konferenz? Wer sollte zu ihr gehen? Was hat sich gegenüber dem Vorjahr geändert? Wir reden über alles unter dem Schnitt.

Die Hauptsache
Das Format der Konferenz ist dem Programmkomitee am besten bekannt - Personen, die Berichte auswählen und zu deren Verbesserung beitragen. Deshalb haben wir die Teilnehmer des PC befragt und diesen Text mit ihrer direkten Rede ergänzt.
Roman p0b0rchy Poborchiy , der uns bei der Vorbereitung der ersten SmartData
ein Interview gab , war wieder der gesprächigste von allen.
Der erste bemerkenswerte Unterschied der neuen SmartData besteht darin, dass auf der
Website sofort die Aufzählung angezeigt wird, für wen diese Konferenz bestimmt ist: Data Scientist, Data Engineer, Data Architect und Statistician. Vor einem Jahr war es nur eine "Datenkonferenz". Was steckt hinter dem Hinzufügen bestimmter Rollen?
Roman: „Das letzte Mal haben wir viele Rückmeldungen vom Publikum erhalten, was nicht klar ist, für wen diese Konferenz ist: für einen Dateningenieur oder für einen Datenwissenschaftler? Das Programm hatte Berichte in diesen beiden Bereichen, aber es war für die Menschen nicht offensichtlich.
Jetzt möchten wir explizit angeben, dass das Ereignis für beide gilt. Und genau das versuchen wir so: Im Rahmen von SmartData erhalten wir sowohl eine vollwertige Konferenz für einen Ingenieur als auch eine vollwertige Konferenz für einen Wissenschaftler. Damit jeder von ihnen in jedem Zeitfenster etwas zu hören hatte. “
Das zweite, was auf der Website auffallen kann: Wenn es vor einem Jahr unter dem Namen SmartData einen Untertitel „Über große und intelligente Daten“ gab, wurde dieser jetzt durch die Aufschrift „Konferenz für diejenigen, die in die Welt des maschinellen Lernens, der Analyse und der Datenverarbeitung eintauchen“ ersetzt. Was steckt dahinter?
Tanya Denisyuk (Programmkoordinatorin): „Zum ersten Mal hatten wir eine Positionierungsunsicherheit, und die Beschreibung
enthielt einen Hype-Satz„ Big Data “, der„ zufällige “Personen anziehen könnte. Bei der Konferenz geht es jedoch überhaupt nicht um Hype, sondern um das Eintauchen in die Welt des Arbeitens mit Daten. Deshalb haben wir jetzt diesen Satz entfernt und im Allgemeinen die Positionierung geändert, damit technisch versierte Leute kommen. “
Welche weiteren Änderungen können Sie erwarten?
Roman: „Erstens waren das letzte Mal alle Berichte russischsprachig, und jetzt wollen wir bekannte ausländische Sprecher mitbringen. Wenn möglich, auch diejenigen, die nicht sehr oft in Russland sind. Es ist zu früh, um hier etwas zu versprechen, aber die Arbeit ist im Gange.
Und zweitens möchten wir, dass die Konferenz nicht nur Berichte enthält, sondern auch eine andere interessante „Magie“ im Zusammenhang mit der Datenverarbeitung. Vielleicht in Form von interaktiven Dingen, die in den Pausen gestoßen werden können. Und vielleicht in Form von Diskussionen, bei denen die Teilnehmer Themen von Interesse erklären können. “

Besonderheiten
Da die Konferenz noch einige Monate entfernt ist, werden die meisten Redner und Berichte näher an den Punkt kommen. Aber jetzt können wir Beispiele geben, die Ihnen einen Eindruck vom Programm vermitteln:

Die Textanalyse ist ein ehrgeiziger und wichtiger Bereich: Es ist offensichtlich, dass die Menschheit noch nicht viel erreicht hat, aber Fortschritte sind im Gange, und ihre Erfolge können der Menschheit großen Nutzen bringen. All dies ist sowohl aus wissenschaftlicher als auch aus angewandter Sicht interessant.
Für solche Themen ist ein Sprecher des entsprechenden Kalibers erforderlich, und es wird auf SmartData sein.
Konstantin Woronzow ist einer der bekanntesten russischen Spezialisten für maschinelles Lernen. Außerdem sieht er das Bild von beiden Seiten gleichzeitig, "akademisch" und "industriell": Konstantin ist gleichzeitig leitender Forscher am Rechenzentrum der Russischen Akademie der Wissenschaften und Experte von Yandex.

Wer kann mehr über Gesichtserkennung wissen als andere? Derjenige, zu dem Benutzer jeden Tag zig Millionen Fotos hochladen.
Alexander Tobol , der bei Odnoklassniki arbeitet, weiß jetzt, wie man Gesichtserkennung auch bei großen Maßstäben und hohen Belastungen effektiv realisiert. Und auf SmartData wird Wissen mit anderen geteilt: was zu verwenden ist, wie zu optimieren ist, wann umgeschult werden muss.

Diejenigen, die bei den vorherigen SmartData waren, müssen
Ivan Yamshchikov nicht vertreten: seine Präsentation
„Warum haben wir dem neuronalen Netzwerk beigebracht, Gedichte im Stil von Kurt Cobain zu schreiben?“ hat die Publikumsbewertung übertroffen. Und für diejenigen, die nicht dort waren, fügen wir hinzu, dass Ivan am Max-Planck-Institut arbeitet und sich für die Prinzipien der künstlichen Intelligenz interessiert, die helfen könnten, die Funktionsweise unseres Gehirns zu verstehen.
Jetzt wird er einen völlig anderen Bericht erstellen, und Ivan selbst beschreibt ihn folgendermaßen: „Wir werden darüber sprechen, wie sich der Einsatz von maschinellem Lernen in der rauen Unternehmenswelt von B2C unterscheidet, wir werden herausfinden, ob es möglich ist, KI-Lösungen unter Bedingungen von Datenmangel zu entwickeln, und die besten diskutieren die Praxis des maschinellen Lernens unter „Kampfbedingungen“ anhand von ABBYY-Produktbeispielen. “

Wie kann das Yandex-Logo in der Apple-Präsentation angezeigt werden? Dank der CatBoost Gradient Boost Library: Als das maschinelle Lernen auf der Keynote der WWDC 2018 begann, fiel sein Name mit Giganten wie TensorFlow und Caffe auf eine Folie.
Im vergangenen Jahr
sprach Anna Veronika Dorogush vom CatBoost-Team bereits über das Projekt auf SmartData, und nach dem Bericht war sie direkt von Fragen umgeben. Seitdem hat die Bibliothek sowohl neue Funktionen als auch neue Stars
auf GitHub - anscheinend wird es wieder sehr nützlich sein, für Sprecher gibt es spezielle Diskussionszonen für SmartData-Sprecher.
Und wir machen Sie auch darauf aufmerksam, dass der
Empfang von Berichten jetzt in vollem Gange ist. Wenn Sie also mit Daten arbeiten und etwas zu teilen haben, behalten Sie es nicht und kontaktieren Sie es!

Wer sind die Richter?
In diesem Jahr hat das Programmkomitee von SmartData viele neue Gesichter. Und da diese Personen davon abhängen, was sie von dem Programm erwarten können, ist es sinnvoll zu verstehen, auf welcher Seite sie sich selbst mit Datenverarbeitungsaufgaben befassen. Wir haben die Teilnehmer am PC gebeten, uns kurz von sich zu erzählen.
Anton ZlodeiBaal Maltsev : „Ich mache seit 10 Jahren Computer Vision. Wir (zwei oder drei Klassenkameraden aus Fiztekh) erledigen entweder Aufgaben auf Bestellung oder unsere eigenen Matmodels, Module, die wir dann verkaufen und implementieren. Etwas zwischen einem Startup und einer benutzerdefinierten Entwicklung. Seit 10 Jahren werden unsere Lösungen bereits viel wo implementiert. Zuallererst ist dies eine andere Biometrie, die mit Computer Vision verbunden ist: Erkennung der Iris, Venen der Hände, ein wenig Gesichtserkennung. Es gibt auch Lösungen mit der Erkennung von Waren in Regalen, Autonummern und Zügen. “
Alexander Sterligov : „Ich habe bei Yandex gearbeitet und war im Cloud-Management tätig. Dies liegt an Daten in dem Sinne, dass Clouds eine große Anzahl von Servern sind, sie ausfallen, es zu Fehlfunktionen kommt, Sie Ihre eigene Software auf jedem Server bereitstellen müssen und alles sowieso von den Daten abhängt. Jetzt arbeite ich im Joom-Projekt und bin verantwortlich für die gesamte Analyseplattform und -infrastruktur: Datenerfassung, Datenerfassung, Verarbeitung. Ich biete Tools für die Arbeit von Analysten und Datenwissenschaftlern. “
Alexey Tikhonov : „Ich arbeite in Yandex: Fünf Jahre lang war ich in der Suchanalyse tätig, jetzt in der Designanalyse. Darüber hinaus ist er an Projekten wie Yandex.Autopoet beteiligt und fertigt im Geiste von "Neural Defense" und Neurona. "
Pavel Plotnikov : „Ich arbeite bei Wrike, habe als Automatisierungsingenieur in der Analytikabteilung angefangen und bin dann Dateningenieur geworden. Ich habe viel Zeit mit Spark verbracht, dann haben wir versucht, einen Mesos-Cluster zu erstellen, um Spark-Aufgaben zu planen und Ressourcen für sie zuzuweisen. Gleichzeitig haben sie eine Plattform geschaffen, auf der Dienste gestartet werden können (wie Kubernetes war es damals nicht so beliebt). Jetzt werde ich Analytics Ops genannt, da die Dateningenieure in mehrere Unterabteilungen unterteilt sind und ich mich jetzt mehr mit Infrastruktur und Tools befasse. "
Nikita Povarov : „Ich bei JetBrains versuche, die Heuristiken in der IDE durch maschinelles Lernen zu ersetzen (wo es Sinn macht). "Früher beschäftigte ich mich mit Yandex-Metriken in A / B-Experimenten, im Allgemeinen A / B-Experimenten, und jetzt berate ich manchmal einige externe Unternehmen zu diesem Thema."
Roman Poborchiy : „Ich habe auch viele Jahre in Yandex gearbeitet, die ganze Zeit dort mit Leuten, die alle möglichen interessanten Dinge im Zusammenhang mit Daten gemacht haben, und ich selbst habe mich daran beteiligt. Und es scheint mir auch, dass ich in erster Näherung gelernt habe, die Gegenwart von der Fälschung zu unterscheiden, und ich möchte eine Konferenz organisieren, bei der es nur die Gegenwart ohne Hype für diejenigen Menschen geben wird, die wirklich etwas tun. Zum ersten Mal war dies teilweise erfolgreich, aber jetzt möchte ich es komplett machen. “
Und
Vitaly Khudobakhshov blieb unaufgefordert, aber Sie können ihn bereits aus dem
Habrapost und dem
Bericht darüber kennen, wie die Wahrscheinlichkeit, in einer Beziehung zu sein, vom Namen einer Person abhängt. Dieser Beitrag wurde dank Vitalys Arbeit bei Odnoklassniki veröffentlicht. Jetzt hat er eine neue Haupttätigkeit: Er befasst sich mit der Entwicklung von Data Science-Tools in JetBrains.

Tickets
Es gibt auch Änderungen bei Tickets gegenüber dem Vorjahr.
Folgendes bleibt unverändert: Wenn sich die Konferenz nähert, steigt der Preis. Daher ist es sinnvoll, so früh wie möglich zu kaufen (die nächste Preiserhöhung ist bereits der 1. Juli).
Aber was sich ändert: Anstelle eines einzigen Preises für alle sind jetzt mehrere Optionen erschienen. Für Teilnehmer, die in einem großen Unternehmen arbeiten und auf eigene Kosten zur Konferenz gehen, ist im Allgemeinen alles still. Für ein kleines Unternehmen, das ein besseres Gespür für Ticketpreise hat, ist jetzt ein Rabatt erschienen. Und für diejenigen, die "alleine" gehen, ist der Rabatt sogar noch größer.
Tickets sind bereits
auf der Website erhältlich . Dort wird auch der gesamte Nachschub im Programm angezeigt. Wenn Sie sich bereits für die Konferenz entschieden haben, folgen Sie dem Link jetzt und öffnen Sie ihn in Zukunft, wenn Sie weitere Daten dafür benötigen.
Wir sehen uns bei SmartData!
