No es ningún secreto que a los científicos les gusta mucho explorar el mundo. Por lo tanto, las principales conferencias siempre se llevan a cabo en las capitales históricas y culturales del mundo. Estas ciudades son convenientes para visitar a personas de todo el mundo y son interesantes desde el punto de vista turístico. Pero a veces el deseo de explorar lo nuevo y lo desconocido se hace cargo, y la ciudad de la conferencia se convierte, por ejemplo, en Anchorage en Alaska. ¿Tampoco escuchaste de él antes de eso? Y este año se celebró una de las conferencias más grandes de KDD'19 .

Nosotros, en Antiplagiarism , no podríamos perdernos tal evento y partir para enfrentar aventuras en el otro lado del globo. Lo que sucedió en KDD 2019: ¡lea nuestra reseña!
Mi viaje comenzó con un vuelo de 12 horas a Los Ángeles, donde el amigo local de mi amigo ya me había conocido en el aeropuerto. Inicialmente, planeaba caminar por la ciudad por mi cuenta, pero el argumento "no verás nada sin un automóvil en Los Ángeles, y nadie te llevará de regreso al aeropuerto por atascos de tráfico" sonaba bastante convincente. Bueno, sin un automóvil en la ciudad de los ángeles realmente no se puede llegar a ningún lado: prácticamente no hay transporte público aquí, y el que está en condiciones bastante indecentes. LA parecía estar en una lista: enormes embotellamientos, una playa en toda la ciudad, Hollywood Hills, Beverly Hills, almuerzo en una comida rápida estadounidense clásica y puesta de sol en la playa. Pero todas las cosas interesantes tienden a terminar, y el próximo vuelo me estaba esperando.

Como volé desde el otro hemisferio, mi cuerpo no pensó nada, por lo que el vuelo nocturno de 5 horas a Alaska pasó desapercibido para mí. Sin embargo, para recuperarme de alguna manera, me fui a la cama durante 4 horas, como siempre.
El cambio de zonas horarias posteriormente se hizo sentir: todo el tiempo quería dormir. Para no caer completamente, fui a registrarme. Además, la caminata desde el albergue hasta el lugar de la conferencia permitió animarse un poco.
El dispositivo de conferencia no era inusual en nada: varias sesiones dispersas en diferentes salas donde se realizan presentaciones y debates sobre nuevos enfoques para el aprendizaje automático y soluciones e implementaciones geniales. Una advertencia: en el caso de KDD'19, toda la conferencia ocupó dos enormes edificios de conferencias con varios pisos con un montón de audiencias en cada uno de ellos. Como siempre, algunas presentaciones despertaron tanto interés que ni siquiera se podía llegar a la audiencia a través de una multitud de personas. En una palabra, cada participante de la conferencia podría encontrar algo interesante específicamente para él. KDD siempre ofrece muchos formatos diferentes para presentar información, por lo que había mucho para elegir. Estos son informes de científicos famosos que transmiten a grandes audiencias de "transmisión", y presentaciones de recién llegados a la ciencia en pequeñas salas de "seminarios". Para aquellos que desean no solo escuchar, sino también practicar, existen “tutoriales prácticos” donde representantes de diferentes campos realizan ejercicios prácticos. Por ejemplo, el tutorial de Amazon sobre cómo usar su servicio de computación en la nube fue bastante popular. Sin embargo, el primer día fue bastante ligero: estaba reservado para el registro, no hubo presentaciones serias aquí, solo palabras de bienvenida y conferencias de revisión. Así que fui a mi habitación, preparándome para las próximas actuaciones.
Donde el nuestro no desapareció
B - seguridad, pero no harás nada por el bien de la ciencia. Y en general, no fue en vano que el PhysTech terminó.
El segundo día estuvo completamente dedicado a los talleres. En palabras simples, un taller es una reunión donde los participantes intercambian experiencias para resolver problemas en un área determinada. Dado que nuestro departamento en la compañía Anti-Plagiarism está involucrado en un sistema de búsqueda de préstamos en varios idiomas , nuestro trabajo, que presenté en la conferencia, se adaptó de inmediato a los temas de dos talleres: Aprendizaje profundo para la educación y Descubrimiento de la verdad y Verificación de hechos. Antes de mis informes, pude ver algunas presentaciones interesantes. Vale la pena señalar la historia de Ruslan Salakhutdinov sobre el modelo XLNet . Por supuesto, escribieron sobre este modelo antes de KDD, pero escuchar directamente de uno de los autores fue mucho más interesante. Parte del informe se dedicó a una nueva tendencia en el aprendizaje automático: en lugar de enseñar modelos pesados, use modelos previamente entrenados y simplemente personalícelos según sus necesidades. Esto es comprensible: la mayoría de las compañías que de alguna manera usan arquitecturas complejas en sus actividades no tienen suficiente poder de cómputo para aprender desde cero. Y volver a capacitar modelos listos para sus tareas es mucho más simple y rápido. Además, la calidad del trabajo de dichos modelos es mucho mayor que la de los análogos simplificados.
Todo el tiempo restante después del almuerzo se dedicó a la búsqueda de sus audiencias, comunicándose con los jefes de talleres y otros detalles de la organización. Mi primer informe fue en el taller de Aprendizaje profundo para la educación . Estaba justo después de la pausa para el café, por lo que la audiencia estaba vacía. Describí cómo funciona el modelo de búsqueda de préstamos en varios idiomas y algunos detalles de implementación. Al final del informe, preguntaron si este sistema ya estaba funcionando en la práctica y se sorprendieron al recibir una respuesta afirmativa. El siguiente taller, Truth Discovery and Fact Checking , ya tenía una audiencia completa. Después del discurso, hubo varias preguntas. Por ejemplo, uno de los oyentes preguntó si había ejemplos específicos de tales préstamos. Mi respuesta de que esto, desafortunadamente, es una práctica bastante popular entre los estudiantes de instituciones superiores de Rusia y los países de la CEI, lo sumió en un ligero malentendido. En general, el informe fue recibido con interés, la audiencia estaba claramente interesada en usar proyectos transversales para resolver problemas prácticos en el campo de la educación.
La gama de temas, incluso dentro de un taller, es muy amplia. Por ejemplo, un estudiante de la Universidad de California en Berkeley habló frente a mí y habló sobre un sistema que ayuda a los estudiantes estadounidenses a elegir cursos alternativos. Dado el curso completo de asignaturas tomadas por un estudiante en particular, el sistema le ofrece nuevos cursos que probablemente sean interesantes para este estudiante. Se tomó como base de datos una base de datos de estudiantes de la Universidad de California en los últimos 10 años. ¡Y esta es información sobre casi 165 mil estudiantes durante la capacitación! Otro informe se dedicó al sistema de distribución automática de becas entre estudiantes. En las universidades estadounidenses, el tema de las becas es a menudo mucho más complicado que en Rusia, y requiere el análisis de una gran cantidad de información sobre el estudiante. Como resultado, la decisión de la comisión de becas se toma por mucho tiempo. Sería muy conveniente tener un sistema que analizara y distribuye becas. Después de deambular por el resto de los talleres el resto del tiempo, me fui a casa con una sensación de logro.
Al día siguiente, comenzó la conferencia principal. Al mismo tiempo, se organizó una sesión en la que los patrocinadores de la compañía hablaron sobre sus últimos desarrollos en el modo de comunicación. Fue bastante interesante caminar, mirar el Titan RTX de Nvidia en vivo, escuchar los desarrollos de Facebook Research en el campo del reconocimiento de imágenes y aprender sobre muchos otros gigantes de la industria, algunos de los cuales nunca había escuchado antes.

El cuarto día también consistió principalmente en informes. Uno, por ejemplo, estaba dedicado al problema de la interpretabilidad de los modelos de aprendizaje automático. Más precisamente, su ausencia en muchos casos. Los modelos modernos resuelven problemas con bastante precisión en diferentes campos del conocimiento, como dicen, "listos para usar". Sin embargo, en muchos casos es necesario entender por qué el modelo tomó esta o aquella decisión. En estos casos, la interpretabilidad es importante. Un método bastante popular es la aproximación local de modelos, que le permite considerar el comportamiento del modelo con un ejemplo específico y con un cierto grado de precisión para comprender qué influyó en la decisión. La presentación se dedicó a métodos similares y sus mejoras.
En la parte posterior del globo
Las montañas no están allí solo donde hay una bahía. Entonces no puedes escapar de esta ciudad.
Al final del día, un banquete dedicado al 25 aniversario de KDD estaba esperando a todos. Una vez más, estaba convencido de que se trataba de una conferencia a gran escala, pero celebrar un banquete para todos los participantes a la vez en una sala era, por supuesto, una decisión controvertida.

El día siguiente fue el último, y esto se sintió: el número de oyentes disminuyó considerablemente (tal vez esto fue facilitado por el bar en el banquete, pero esto no es seguro). Sí, y los informes fueron en su mayoría revisados. Muchas conferencias destacaron problemas y tareas actuales que deben abordarse. Procesamiento de datos, crecimiento a una velocidad increíble, ciberseguridad, tareas médicas: en una palabra, la conferencia, aunque es altamente especializada, no se puede decir con certeza sobre la variedad de temas discutidos. Pero, nuevamente, toda la diversión termina tarde o temprano, y era hora de que me fuera a casa.
Antes de partir, decidí tomar un descanso y explorar los alrededores. Cuando conducía desde el aeropuerto de Anchorage, un amable taxista le recomendó subir al monte Flattop, una atracción local con una "vista fantástica". A juzgar por la cantidad de personas que se encontraron en el camino a la cima, esta es realmente una leyenda local, aunque no diría que la escalada es bastante simple: debes superar una roca empinada con un montón de piedras desmoronadas en el camino. Pero el esfuerzo valió la pena: ¡la vista desde la cima es realmente impresionante!

El viaje de regreso no difirió en nada especial. Caminar por Los Ángeles ya no estaba previsto, así que pasé parte del tiempo de transferencia acostado en una playa vacía de California (nadie irá allí a las 8 de la mañana). Una larga búsqueda previa al vuelo, otras 12 horas en el aire, y finalmente en el lluvioso y frío Moscú. En general, la conferencia dejó solo impresiones positivas. Reunir en un solo lugar a personas de diferentes intereses, nacionalidades y puntos de vista realmente merece un enorme esfuerzo. Y esto también se hace para que todos tengan algo que escuchar o contar, y todo sucede en una atmósfera propicia para esto. Creo que valió la pena volar a casi el lado opuesto del planeta.