Hola, esto es Smart Engines. El grupo de aterrizaje de 28 desarrolladores de sistemas de reconocimiento de inteligencia artificial acaba de regresar de Amsterdam, donde participamos en la conferencia científica internacional ICMV sobre visión por computadora. En el artículo trataremos de explicar por qué dedicamos tanto tiempo a la ciencia y asistimos a conferencias científicas.
Hoy en el mundo del desarrollo de la ciencia y la alta tecnología ha habido una sustitución catastrófica de conceptos: para la ciencia se emite que la ciencia no se aproxima de ninguna manera, los científicos llaman programadores e ingenieros, la ciencia llama la solución a los problemas de ingeniería más simples. En el espacio de la información, el papel de la ciencia fundamental en el desarrollo de la tecnología está claramente subestimado. Muchas personas olvidan que la pantalla táctil del iPhone no es la pantalla táctil del iPhone en sí, sino la implementación de las ideas de investigación fundamental sobre las heteroestructuras de semiconductores de nuestro compatriota ganador del Premio Nobel J.I. Alferova Los mapas de Google (o Yandex) no son solo mapas en un teléfono móvil, sino la encarnación de una investigación fundamental en el campo de la geometría computacional. Y, por cierto, la película "Avatar" también tiene un 99% de geometría computacional. La visión artificial, las redes neuronales y la inteligencia artificial no son una excepción: todo este complejo funciona bien y correctamente solo porque la investigación fundamental es la base. Un enfoque fundamental para el desarrollo, por un lado, es la clave para el vector correcto para el desarrollo de la industria, y por otro, demuestra varias nuevas empresas de garaje que inundaron el mercado, lo que la ciencia fundamental siempre ofrece una clara ventaja.Somos cientificos Somos científicos y no lo dudamos en absoluto. Nuestra startup (que de hecho no ha sido una startup durante mucho tiempo, sino un negocio que funciona bastante bien, conocido tanto en Rusia como en el extranjero, desarrollado exclusivamente debido a las tecnologías desarrolladas sin ninguna inversión del estado o fondos) se trata de eso. , que todo el mundo está escuchando hoy: visión por computadora, aprendizaje automático, inteligencia artificial, redes neuronales, en general, todo el conjunto de palabras bingo de mierda, cuyo uso, según muchas startups, hace que el proyecto sea obviamente exitoso. Esto, por supuesto, no es así. Es importante si comprende la esencia del problema. Es por eso que muchos comienzos desde la posición
superior se encuentran muy rápidamente en la posición
inferior y luego en la posición externa. Porque no los científicos.
Raramente asistimos a reuniones de startups, visionarios y evangelistas en el campo de la inteligencia artificial. El hecho es que ahora todos han aprendido a hacer hermosas presentaciones. Quien no aprendió - encontró un contratista. Se invierten enormes recursos en la promoción y promoción de soluciones tecnológicas (primero para atraer inversiones y luego para justificar las actividades de un equipo débil), para lo cual no hay novedad ni eficiencia. En un hermoso envoltorio para presentaciones, infografías y animaciones, especialmente cuando se entrelazan términos científicos y tecnológicos oscuros y de moda, siempre se puede ocultar la falta de un sentido real de actividad. Para muchas presentaciones no hay ciencia. Es un vacío envuelto en una hermosa concha. Este es un cebo para los inversores que picotean (o pretenden picotear) vidrio brillante y dan dinero por alguna razón. En realidad, pocas personas quieren entender el componente científico, la mayoría prefiere prestar atención al exterior del "lanzamiento". Qué hacer: economía de presentación en acción. Y no estamos hablando de eso. Somos sobre ciencia.
Vamos a conferencias científicas. Por ejemplo, recientemente visitamos Australia en una conferencia de reconocimiento de documentos. Rusia, y no solo eso, es un país con un mayor nivel de desarrollo de la burocracia. Algunos, sufriendo, recogen trozos de papel, otros con no menos sufrimiento trabajan con ellos. Los ministerios anuncian licitaciones para la digitalización y automatización de procesos rutinarios, aparecen compañías ejecutoras bastante serias que ofrecen sus enfoques en esta área. Desde las alturas se explica que esta vez es hora de reemplazar no solo el ojo y la mano, sino que estamos hablando de inteligencia artificial que puede comprender documentos de manera significativa. Y en este contexto, es muy extraño que solo Abbyy y nosotros estuviéramos en la conferencia líder de Rusia. No vimos representantes de los buques insignia de la transformación digital y participantes en el programa estatal para el desarrollo de la inteligencia artificial. Resulta que en el campo de la comprensión de documentos en Rusia no hay más científicos?

Acabamos de regresar de Amsterdam, donde se realizó la
ICMV , una conferencia científica sobre visión por computadora. Allí, no establecimos el objetivo de promover el éxito de nuestra empresa como estructura comercial. Le dijimos a la comunidad de profesionales en qué problemas fundamentales está trabajando nuestro equipo de investigación. Para nuestros jóvenes científicos (son precisamente los jóvenes empleados quienes ofrecen y desarrollan ideas audaces en nuestro campo quienes actúan como oradores principales en la conferencia) esta es una oportunidad para sumergirnos en la actividad científica, para desarrollarnos científica y profesionalmente.
Estamos seguros de que para que una startup
"despegue" y se convierta en un negocio en desarrollo, debe basarse en la ciencia, a partir de la cual crecerá una tecnología que funcione, que es el "motor" de un servicio o producto que el mercado demanda y cumple con sus requisitos.
En nuestra área, áreas de reconocimiento (estos son documentos de identificación, varios perfiles, tarjetas bancarias, tablas, códigos de barras, imágenes), la tecnología y la ciencia subyacentes son la base. El precio del error es muy alto, y es por eso que tenemos requisitos muy altos para los algoritmos. Es como un avión: vuela o no vuela, no hay un tercero. Si vuela mal, significa que no vuela en absoluto. Y al igual que en la fabricación de aviones, el algoritmo se basa en la ciencia, una ciencia fundamental seria que ha surgido del trabajo atrasado de nuestros compatriotas que estaban en los orígenes de nuestra inteligencia artificial doméstica. Muchos ahora están comprometidos con el reconocimiento, creando un mercado para estos servicios, que todavía está en pañales. No está completamente formado, a pesar del hecho de que los analistas predicen el volumen global de este mercado a 16-17 mil millones de dólares para 2024. Pero vemos muy pocos colegas en conferencias científicas. Aún menos son los publicados en revistas científicas. Ahora podemos escuchar cómo nos llegaron las zapatillas de principiantes indignados, que seguramente están convencidos de la inutilidad de realizar investigaciones y escribir artículos. "¡Estamos haciendo negocios, no una especie de ciencia teórica!". Es precisamente por eso que muchos sistemas de reconocimiento en el mercado funcionan francamente mal (a pesar de los hermosos videos de presentación y los lemas publicitarios), están equivocados, requieren la participación de un operador humano (o una fábrica completa de estos operadores) , que examinará la imagen borrosa y ajustará la decisión de la máquina con sus propias manijas cansadas. Pero la tarea es lograr que el proceso de reconocimiento esté completamente automatizado. En nuestro caso, esto no significa eliminar el error por completo, sino hacer que la máquina cometa errores muchas veces, decenas y cientos de veces con menos frecuencia que los humanos.
Trabajamos constantemente para mejorar nuestra propia tecnología. Este es un proceso asociado con mucho trabajo teórico e investigación seria. En tecnología, mejoramos la precisión, la velocidad, la flexibilidad, hacemos que la tecnología sea más "ligera", menos exigente en hardware y menos intensiva en energía. Esta es nuestra "IA verde" (el verde no es en el sentido de "inmaduro", sino en el sentido de "verde"). Entendemos que la tecnología ambiental es una tendencia. Y los clientes potenciales en el mundo se aferrarán a esta tendencia. Y obtuvimos una comprensión de esta tendencia precisamente de la participación en conferencias científicas. Como dice el proverbio escandinavo, "cuando cortas el bosque, no olvides afilar el hacha a tiempo". La participación en conferencias científicas para nosotros es solo el proceso de afilar un hacha. La tecnología no puede crecer desde cero, la comprensión de cómo se puede mejorar no aparece de inmediato. La comunidad científica está organizada de una manera fundamentalmente diferente a la comunidad de nuevas empresas, inversores, analistas de blockchain y visionarios tecnológicos. No es suficiente mostrar una hermosa presentación. Si no hay pensamiento y novedad en ello, picotearán. Comerán y enterrarán. Sí, y organizado en conferencias científicas, todo es un poco diferente. Mostramos allí no el resultado final, sino lo que conduce a él, describimos los métodos y enfoques, pisoteamos un claro para nosotros mismos, presentamos al mundo los resultados de nuestra propia investigación. No es suficiente mostrar lo que has hecho, es necesario explicar cómo funciona.
Ahora, muchas nuevas empresas en el campo de la IA son talleres de reparación de automóviles tan peculiares donde no reparan el automóvil, sino que reemplazan los nodos defectuosos. Algo no funciona: no lo reparamos, cambiamos inmediatamente el módulo. Esto es más fácil, especialmente cuando no sabes cómo funciona todo y qué necesitas hacer para solucionarlo.
Somos científicos y demostramos con bastante confianza: la tecnología basada en la ciencia fundamental profunda funciona mejor, más rápido, con más confianza y más confiabilidad que aquella de todas las tecnologías donde solo hay una presentación hermosa. Se rompe menos, consume menos energía, trabaja en la nieve, en el calor, en la noche y en la mañana, ya que sabemos qué tipo de
neón hay en su "interior" , en qué lugar es necesario "
tirar de la niña " y golpear la pandereta.
Nuestra empresa emplea a más de 50 desarrolladores, cada uno de los cuales destruye la tesis de la falta de demanda de trabajo científico. Nuestro equipo incluye científicos establecidos y aquellos que recién comienzan su carrera en una carrera científica. Hacemos hincapié en que estos no son solo programadores que se ocupan exclusivamente del código. Cada uno de ellos es una unidad científica independiente, a partir de la cual se forma el equipo científico, se garantiza la flexibilidad y variabilidad de las soluciones utilizadas.
Y todo porque vamos a conferencias científicas.


En la conferencia internacional sobre visión por computadora (ICMV) en Amsterdam, propusimos nuestros enfoques fundamentalmente nuevos para el desarrollo de redes neuronales y tecnologías de reconocimiento, que tienen como objetivo reducir la huella de carbono y minimizar el daño ambiental por el uso de nuevas tecnologías. El énfasis principal se puso en la optimización de los algoritmos computacionales utilizados en los sistemas de hardware y software, que deberían reducir el consumo de energía para el entrenamiento y el funcionamiento de las redes neuronales a escala global.
Hoy, el desarrollo sostenible de nuestro planeta se está convirtiendo en la agenda principal en los informes de las organizaciones mundiales preocupadas por el futuro de la Tierra. Y esto no es solo Greta Tunberg. El lugar de una persona en el planeta en muchos aspectos depende de cuánto podamos lograr un equilibrio entre el desarrollo de tecnologías, los crecientes apetitos de las corporaciones globales y la actitud responsable hacia el medio ambiente. Las posibles formas de minimizar el daño de las tecnologías de rápido desarrollo de la última década se asocian en gran medida con la reducción del consumo de energía y la búsqueda de las herramientas más óptimas y eficientes para resolver problemas tecnológicos modernos.
Nuestro arsenal tiene redes neuronales y es nuestra responsabilidad, los científicos, hacer que funcionen de manera rápida, eficiente y resolver correctamente las tareas que se les asignan. Desde el punto de vista de la "inteligencia artificial verde", la cuestión de un avance no es crear una red neuronal grande, poderosa y enorme, una especie de ballena azul con su red neuronal sorprendentemente grande, sino una mosca, con sus capacidades "computacionales" muy modestas, sino su capacidad para La energía resuelve eficientemente las tareas necesarias. Dicha red neuronal debería tener una productividad específica completamente alta. La elección correcta de algoritmos le permite gastar 1000 veces menos recursos en tareas de reconocimiento de imágenes de lo que algunos fabricantes de equipos afirman hoy.

Hoy entendemos que en nuestra área, aumentar la capacidad de los dispositivos para realizar operaciones es un boleto de ida. Y la tarea de los científicos de hoy (con una actitud responsable hacia el desarrollo) es hacer que la tecnología cargue los dispositivos lo menos posible, no haga que el procesador se caliente a la temperatura de la caldera, no coma energía, como un "cadáver gastro-insatisfecho". Y luego esta tecnología se vuelve fácil de usar y al mismo tiempo de alta tecnología.
Para que esto se convierta en realidad, se requieren "paquetes" completamente obvios de campos de ciencia completamente diferentes. ¿Está claro para muchos que cambiar las tecnologías de aprendizaje profundo al álgebra tropical puede reducir drásticamente la cantidad de transistores en los neuroprocesadores mientras se mantiene el poder expresivo? ¿O que la presencia de capas de radón en una red neuronal le permite describir económicamente invariantes proyectivos que, a su vez, determinan la estructura interna de las imágenes del mundo real?
La participación en conferencias científicas es, en primer lugar, una oportunidad para comparar relojes con líderes mundiales, para ver a sus competidores reales (sí, los competidores reales también van a conferencias científicas porque también son científicos), para ver hacia dónde se mueven las tecnologías de primera mano, y no en el recuento de visionarios y evangelistas, que en su mayor parte no tienen nada que ver con la ciencia real, sino que solo aprendieron a poner palabras de moda en oraciones relativamente alfabetizadas. Sin esta comprensión de las tendencias y tendencias en la ciencia fundamental, no es posible avanzar. La tecnología sin ciencia "no despegará", o ya será obsoleta de antemano.