
SmartData-Konferenzteilnehmer sind Menschen, die gerne mit Daten arbeiten. Es ist davon auszugehen, dass sie ihre EinschÀtzungen der Berichte nach der letztjÀhrigen Konferenz sehr nachdenklich vorgenommen haben.
Und jetzt haben wir nach diesen SchĂ€tzungen die Top 10 Videos zusammengestellt. Gleichzeitig gaben sie, um Datenbegeisterten zu gefallen, alle zugehörigen Zahlen fĂŒr jeden der zehn Berichte an: Platz oben, genaue Zuschauerbewertung, Anzahl der Zuschauer.
Generell unterscheiden sich die Bewertungen an den Spitzenpositionen oft nicht wesentlich. Vielleicht sollten Sie âwer folgt wemâ keine groĂe Bedeutung beimessen - es ist wichtiger, dass alle diese Berichte gute Noten erhalten. Aber wie kann es Zahlen nicht viel Aufmerksamkeit schenken, wenn es so aufregend ist?
Neurona: Warum haben wir dem neuronalen Netzwerk beigebracht, Gedichte im Geiste von Kurt Cobain zu schreiben?
Sprecher:
Ivan YamshchikovOrt: 1
Bewertung: 4,51 ± 0,08
Die Anzahl der Zuschauer: ~ 200
PrĂ€sentation prĂ€sentierenDer klare Leiter der Konferenz war die Abschlussrede des Erstellers der Projekte Neural Defense und Neurona. Dies ist eine zugĂ€ngliche AuffĂŒhrung, die vom Betrachter keine enorme Vorbereitung erfordert - gleichzeitig aber nicht nur eine hunderttausendste ErklĂ€rung fĂŒr die Funktionsweise neuronaler Netze. Dies scheint ein "unterhaltsames" Format zu sein (es ist unwahrscheinlich, dass das, was Sie sofort hören, Ihr Arbeitsprojekt beeinflusst) - aber auf lange Sicht kann dies alles nicht nur sehr interessant, sondern auch nĂŒtzlich sein. Im Allgemeinen ist es kein Wunder, dass wir Ivan eingeladen haben, an den kommenden SmartData 2018 teilzunehmen.
Vom Klick zur Prognose und umgekehrt: Data Science-Pipelines in Odnoklassniki
Sprecher:
Dmitry BugaychenkoOrt: 2
Bewertung: 4,36 ± 0,08
Die Anzahl der Zuschauer: ~ 140
PrĂ€sentation prĂ€sentierenUnd hier ist das Gegenteil der Fall. Erstens ist dies kein allgemeines âWas maschinelles Lernen uns geben kannâ, sondern die Besonderheiten von âgenau, wie wir alles implementierenâ. Und der Bericht handelt nicht von ML an sich (die Personalisierung des Newsfeeds dient nur als Beispiel), sondern von allem, was damit zu tun hat: "Was muss getan werden, damit all diese ML-Schönheit funktioniert?" Wenn eine Rede von Yamshchikov sogar ein breites Publikum interessiert, ist sie im Allgemeinen nur persönlich im Zusammenhang mit maschinellem Lernen interessant, aber sie kann viel fĂŒr sich selbst tragen.
CatBoost - Die nÀchste Generation der GradientenverstÀrkung
Sprecherin:
Anna Veronika DorogushOrt: 3
Bewertung: 4,32 ± 0,12
Die Anzahl der Zuschauer: ~ 100
PrĂ€sentation prĂ€sentierenWenn die Erhöhung des Gradienten nicht Ihre SpezialitĂ€t ist und das Thema des Berichts das GefĂŒhl weckte, âes gibt wahrscheinlich Nuancen fĂŒr diejenigen, die dies bereits mit Macht und Kraft tunâ, zerstreuen Sie die BefĂŒrchtungen. Der Bericht ist anfĂ€ngerfreundlich und taucht nicht sofort mit dem Kopf in den Pool ein, sondern erklĂ€rt zunĂ€chst grundlegende Dinge. Und wenn man bedenkt, dass die Yandex CatBoost-Bibliothek im letzten Jahr schöner und beliebter geworden ist als die vorherige, ist es hilfreich, eine Vorstellung davon zu haben, auch wenn Sie sich gerade nicht damit befassen mĂŒssen, und der Bericht kann nur eine gute EinfĂŒhrung sein.
ZurĂŒck in die Zukunft des modernen Bankensystems
Sprecher:
Vladimir KrasilshchikOrt: 4
Bewertung: 4,31 ± 0,17
Die Anzahl der Zuschauer: ~ 80
PrĂ€sentation prĂ€sentierenWas ist zu tun, wenn Ihre vierteljĂ€hrlichen Berichtsdaten aufgrund der eventuellen Konsistenz von den monatlichen abweichen und die PrĂŒfer und Aufsichtsbehörden Fragen haben? Vladimir Krasilshchik erklĂ€rt, dass BitemporalitĂ€t zum SchlĂŒsselkonzept wird: Es gibt âwann das Ereignis passiert istâ und es gibt âwann das System davon erfahren hatâ. Sie mĂŒssen mit beiden Skalen arbeiten und beide dem Drittanbieter-Tester demonstrieren. Der Bericht ist nicht darauf beschrĂ€nkt, es gibt noch viel mehr - haben Sie beispielsweise gedacht, dass Sie auf der IT-Konferenz den Satz âEs gibt keine Gerechtigkeit, und Sie sollten nicht versuchen, ihn zu erstellenâ hören wĂŒrden?
Der Name ist eine Funktion
Sprecher:
Vitaly KhudobakhshovOrt: 5
Bewertung: 4,28 ± 0,08
Die Anzahl der Zuschauer: ~ 280
PrĂ€sentation prĂ€sentierenDie paradoxeste PrĂ€sentation der Konferenz, die Sie dazu zwingt, sich verwirrt am Kopf zu kratzen. Einerseits ist es fĂŒr jede vernĂŒnftige Person völlig offensichtlich: Es gibt keine erkennbaren GrĂŒnde fĂŒr die Korrelation des Namens einer Person (wenn es sich um populĂ€re russische Namen handelt) und ob diese Person in einer Beziehung sein wird. Auf der anderen Seite prĂ€sentiert Vitaly Daten, die das Gegenteil zeigen. Er selbst hatte keine genaue ErklĂ€rung, aber niemand fand wirklich ĂŒberzeugende EinwĂ€nde. Sie können versuchen, sich selbst zu suchen.
Keine Daten? Kein Problem! Deep Learning bei CGI
Sprecher:
Ivan DrokinOrt: 6
Bewertung: 4,26 ± 0,18
Die Anzahl der Zuschauer: ~ 40
PrĂ€sentation prĂ€sentierenWie Sie wissen, reichen Algorithmen nicht fĂŒr tiefes Lernen aus - wir benötigen erste Daten zum Lernen. Infolgedessen ist ein guter Datensatz zu einer wertvollen Ressource geworden. Aber was ist, wenn Sie es jetzt nicht haben und nicht Google sind und keine gigantischen Ressourcen investieren können? Es stellt sich heraus, dass es nicht immer notwendig ist, âechteâ Daten aus der realen Welt zu entnehmen, und unter bestimmten Bedingungen können sie buchstĂ€blich generiert werden. Der Bericht befasst sich mit einem bestimmten Fall dieser Art.
Tiefe Faltungsnetzwerke zur Objekterkennung und Bildsegmentierung
Sprecher:
Sergey NikolenkoOrt: 7
Bewertung: 4,24 ± 0,17
Die Anzahl der Zuschauer: ~ 80
PrĂ€sentation prĂ€sentierenWenn Sie noch weit vom maschinellen / tiefen Lernen im Allgemeinen entfernt sind, können die ersten 20 Minuten dieses Berichts gut erscheinen: Es gibt eine grĂŒndliche EinfĂŒhrung in das Thema mit einer historischen Exkursion, die in den 1950er Jahren beginnt. Und wenn Sie alles darĂŒber als Ganzes verstehen, aber das Unterthema tiefer Faltungsnetzwerke nicht verstehen, können Sie die EinfĂŒhrung sofort ĂŒberspringen und auf die zweite HĂ€lfte des Berichts achten, in der es um verschlungene neuronale Netze geht.
Hadoop HochverfĂŒgbarkeit: Badoo Erfahrung
Sprecher:
Alexander KrashennikovOrt: 8
Bewertung: 4,22 ± 0,14
Die Anzahl der Zuschauer: ~ 100
PrĂ€sentation prĂ€sentierenZusĂ€tzlich zum Konzept von "Big Data" scheint "Grow Data" auch nĂŒtzlich zu sein, da das Wachstum seine eigenen Besonderheiten bestimmt. Sobald Badoo DatengröĂenordnungen kleiner und einen Ansatz fĂŒr sie hatte, wuchs das Volumen und es waren Ănderungen erforderlich - und es sollte bedacht werden, dass morgen alles noch stĂ€rker werden kann und alles âmit einer Margeâ erledigt.
Die Unternehmen interessierten sich fĂŒr die Kombination von âHadoopâ und âEchtzeitâ, selbst wenn sie normalerweise âinkompatibelâ zwischen diesen beiden Wörtern schrieben. Jetzt sprachen sie ĂŒber ihre Erfahrungen mit Hadoop und stellten in diesem Fall eine hohe VerfĂŒgbarkeit bereit. Bonus: ein wenig KreativitĂ€t von Vasily Lozhkin auf den Folien.
Wir segmentieren tÀglich 600 Millionen Benutzer in Echtzeit
Sprecher:
Artyom MarinovOrt: 9
Bewertung: 4,21 ± 0,09
Die Anzahl der Zuschauer: ~ 120
PrĂ€sentation prĂ€sentierenHier unterscheidet sich das Projekt stark von Badoo: Nicht Dating, sondern DMP (Data Management Platform), bei der Sie Segmente wie âHausfrauen mit einem Auto, das Ă€lter als fĂŒnf Jahre istâ im Publikum hervorheben möchten. Erstens gibt es aber auch einen groĂen Umfang (etwa hunderttausend Ereignisse pro Sekunde). Und zweitens mĂŒssen Sie hier noch besser auf Wachstum vorbereitet sein: "Unter den Datenquellen - Pixelinstallation, wenn morgen die sehr beliebte Website Ihr Pixel in sich selbst setzt - wird es einen riesigen Stream geben, der behandelt werden muss." Mit welchen Technologien kommen sie zurecht und wie genau werden sie eingesetzt? Antworten im Bericht.
Verteilte ML auf Big Data: Erfahrung beim Aufbau eines Empfehlungssystems in ivi
Sprecher:
Boris SchminkeOrt: 10
Bewertung: 4,21 ± 0,09
Die Anzahl der Zuschauer: ~ 100
PrĂ€sentation prĂ€sentierenSchlieĂlich geht es im letzten Bericht auch um âInfrastruktur, nicht um Algorithmenâ und basiert auch auf den Erfahrungen eines groĂen Produkts. Es war einmal, als ivi begann, Empfehlungen mithilfe eines Drittanbieter-Service umzusetzen, der âEmpfehlungen als Serviceâ bereitstellte. Dann sind sie daraus âaufgewachsenâ und haben begonnen, ihr eigenes System zu schaffen. Auf HabrĂ© hat das Unternehmen bereits 2014 darĂŒber geschrieben, und aus dem Bericht können Sie sich ĂŒber den aktuellen Stand der Dinge informieren.
Wenn diese Berichte von Interesse sind, beachten Sie bitte: SmartData 2018 wird diesen Herbst stattfinden. Separate Sprecher von diesen Top 10 werden mit neuen Berichten zurĂŒckkehren, es wird völlig neue Namen geben. Die aktuellsten Informationen zum Programm finden Sie immer auf der Website. Dort können Sie auch Tickets kaufen - und der Preis steigt allmĂ€hlich, also sollten Sie jetzt darĂŒber nachdenken.