¿De dónde vienen las redes neuronales y qué está sucediendo ahora?

En los últimos años, el tema de la inteligencia artificial se ha discutido activamente, ya que uno de los enfoques para su estudio está ganando impulso activamente entre las grandes corporaciones. Este enfoque es las redes neuronales. Más recientemente, hace aproximadamente un año, esta palabra se podía escuchar en todas partes. Hoy consideramos la historia del estudio de la inteligencia artificial por parte de la humanidad (resulta que ya tiene unos 2000 años) y las realidades de hoy.



Los autores de este artículo son los chicos de Jedium. Les doy la palabra.

Introduccion


De hecho, gracias al crecimiento de la potencia de cómputo de las computadoras convencionales, se ha vuelto conveniente participar en inteligencia artificial a nivel de software. En la medida en que los artículos sobre cómo "escribir" su red neuronal con un conocimiento mínimo de programación se presentaron en fuentes de TI populares. Sin embargo, antes de profundizar en el estudio de nuestra empresa en esta área, nos gustaría contarle un poco de antecedentes.

La IA no es un descubrimiento del siglo XXI


El rápido desarrollo de esta industria comenzó hace varios años, pero antes de eso, la humanidad ha estado estudiando inteligencia artificial durante un par de miles de años. A partir de Aristóteles y Descartes y terminando con el famoso John von Neumann. Este último hizo una gran contribución al desarrollo de la lógica de una computadora moderna. Hay muchos científicos que han estudiado esta área. Una descripción completa de la historia de la IA tomará más de una serie de artículos con largas transcripciones y explicaciones. El objetivo de la formación científica en IA es transmitir algunos puntos que serán importantes para comprender lo que hace Jedium.

En los años 30 del siglo pasado hubo un gran interés en el estudio de la inteligencia artificial. Los científicos con diferentes enfoques para el estudio de la IA lograron excelentes resultados, cuestionaron las teorías de los demás y probaron otras nuevas. Entonces, por ejemplo, en ese momento, se inventó una prueba de Turing, que sugiere que si en una conversación con dos interlocutores una persona no puede distinguir la IA de otra persona (se supone que la conversación se lleva a cabo utilizando un terminal de computadora para excluir la influencia de la voz, la apariencia y cualidades difamatorias similares ), entonces tenemos una IA completa. Lo más interesante es que una vez que se pasó la prueba. Como resultado, los trabajos de Turing se convirtieron en una base fundamental de conocimiento sobre los sistemas informáticos, que, en base a los datos de entrada, crean sus propios axiomas (juicios que no requieren pruebas). Gracias a los axiomas, los sistemas pueden sacar conclusiones sobre solicitudes específicas del usuario o hacer predicciones con una precisión muy impresionante. En nuestro tiempo, son estos sistemas los que se denominan redes neuronales.

Existen varios enfoques para el estudio de la IA, pero vale la pena destacar al menos dos, con cierta semántica y sin ella. O escribimos lógica o escribimos un programa informático altamente cargado, es decir, una red neuronal. Sin embargo, después del final de los años 40 del siglo pasado y hasta el presente, no se observaron avances importantes en el campo de la IA. Hubo un "invierno", una disminución del interés en el estudio de la inteligencia artificial. Esto se debió a la falta de potencia informática para construir redes neuronales potentes, y el enfoque desde el lado lógico resultó ser abrumadoramente difícil y mostró resultados decepcionantes.

Hace unos años, la potencia informática comenzó a ser suficiente para la construcción de redes neuronales muy potentes. Sin embargo, el interés en ellos entre la gente común adquiere una tendencia negativa, mientras que entre los especialistas, por el contrario, la capacitación continúa. Incluso vale la pena hacer una reserva: las redes neuronales comienzan a adquirir cada vez más la propiedad de las cosas cotidianas y cotidianas. Asistentes de voz en sus dispositivos, visión artificial, que una vez más utiliza para escanear documentos con su teléfono inteligente, editor de fotos y muchos otros ejemplos. La gente se acostumbra y el "efecto sorpresa" se está volviendo cada vez más difícil. Por lo tanto, existe la tesis de que el desarrollo de redes neuronales no se moverá tan rápido durante el futuro cercano, en otras palabras, vendrá un nuevo "invierno".

Pero aunque el trabajo en el estudio de la IA en las empresas no se detiene, la industria tiene serios problemas que impiden la investigación productiva en esta área. Por ejemplo, falta de datos para entrenar redes neuronales. Al estudiar esta conclusión y hacer la pregunta “¿de dónde podemos obtener los datos?”, Encontramos un enfoque interesante que podría ser la solución al problema.

Ejemplo viviente


Los muchachos de Jedium están creando una plataforma que estandariza y simplifica el desarrollo de aplicaciones VR / AR, así como la creación de sistemas de entrenamiento. Mientras trabajaban en esta área, descubrieron interesantes estudios sobre el llamado "conocimiento oculto". El conocimiento oculto es una habilidad que una persona tiene pero no tiene otra. Una persona con conocimiento oculto puede compartirlo. Solo todo el problema radica en el nombre: estas habilidades están ocultas, y hasta que una persona sea informada sobre ellas, no sabrá que las tiene.

El conocimiento oculto es la base del aprendizaje social. Si hay conocimiento que un estudiante puede dar a otros estudiantes, entonces la carga sobre el maestro se reduce. Casi nadie ha probado esta tesis en la práctica: no hay sistemas de software especializados. La compañía se está moviendo en esta dirección. Existe un entorno virtual en el que puede recrear las condiciones para registrar el conocimiento oculto y luego usarlo para transferirlo a otros estudiantes.

Pero para aprovechar el conocimiento oculto y simplemente para crear un entorno de aprendizaje efectivo, necesita elementos suficientemente fuertes de inteligencia artificial. Por ejemplo, para construir un aprendizaje verdaderamente individualizado (Aprendizaje a medida), basado en lagunas en el conocimiento y las preferencias de cada uno de ellos. Y esto requiere algoritmos de análisis de datos efectivos, en realidades modernas: redes neuronales capacitadas.

E-learning moderno


Al crear un sistema moderno de aprendizaje en línea, también vale la pena tener en cuenta las tendencias modernas, y hay varias de ellas, y a menudo es difícil distinguir la frontera entre ellas:

  • La transición de aprender "con un maestro en el centro" a aprender "con un estudiante en el centro". Durante bastante tiempo, se consideró un paradigma exclusivamente clásico en los sistemas de aprendizaje en línea: "el profesor les dice algo a los estudiantes". Al mismo tiempo, no es muy importante qué medios técnicos específicos se utilizaron, ya sea un LMS moderno y herramientas para crear contenido educativo o simplemente presentaciones enviadas a los estudiantes. Ahora hay una opinión general de que el enfoque del sistema de capacitación no debe ser el maestro, sino el estudiante, que recibe conocimiento de una variedad de fuentes y se forma su propia imagen del mundo;
  • Comunicación asíncrona / síncrona. Este es un problema un poco más pequeño en el sentido técnico, ya que no faltan herramientas para la comunicación remota en vivo. Un problema mucho mayor nos parece el uso correcto de tales herramientas, especialmente en el contexto de la planificación de la formación en general. A pesar de que el concepto de aprendizaje mixto (aprendizaje mixto) no es nada nuevo, a menudo nos encontramos con situaciones en las que la comunicación en vivo y el curso de capacitación en sí fueron separados entre sí, sin unirse en un solo sistema. Si hablamos de los métodos de aprendizaje social, generalmente se desarrollaron bastante tiempo "fuera de la corriente principal", lo que, por supuesto, creó una serie de productos bastante interesantes como el Foro del Conocimiento, pero dejó abierta la cuestión de cómo combinar dichos enfoques con los generalmente aceptados.
  • Paradigmas constructivistas y conexionistas. Nuevamente, ambos se ven muy interesantes en combinación con todo lo anterior, pero creemos que todavía no se han encontrado patrones comunes de su aplicación e implementación en el producto de software (a pesar del hecho de que para LMS / LCMS tradicional todo esto ya es largo existe).
  • Simulaciones, juegos serios, juegos de rol. En muchas áreas, este tipo de entrenamiento se considera el mejor. Pero al mismo tiempo, durante mucho tiempo estuvieron algo distantes de los sistemas de capacitación en su conjunto, ni los estándares ni las prácticas de aplicación contribuyeron a esto. Ahora, con la transición de AICC / SCORM a xAPI, existe una oportunidad bastante clara para integrarlos en la capacitación, pero, nuevamente, no hay patrones ni mejores prácticas.

Al crear nuestra plataforma, buscamos enfoques para resolver algunos de estos problemas, mientras tratamos de encontrar una solución no en teoría, sino en un producto de software muy específico con ciertas capacidades. Creemos que esto fue parcialmente posible, pero también vemos que una gran parte de estos problemas requiere un mayor desarrollo de la plataforma y el análisis de su trabajo. Nos gustaría hablar más sobre esto en futuros artículos.

Expandiendo los límites de la inteligencia


Nuestra misión es ampliar los límites del desarrollo intelectual, enriqueciendo el conocimiento social de las personas con los avances tecnológicos.

La teoría de enseñar a las personas se ha desarrollado durante mucho tiempo aislada del progreso tecnológico. Nuestro objetivo es borrar esta barrera logrando sinergias en el trabajo conjunto de la inteligencia humana y de la máquina.

Y comprender en el proceso lo que realmente está sucediendo.

Los autores


Jedium es una empresa asociada de Microsoft que trabaja en el campo de la realidad virtual aumentada y la inteligencia artificial. Jedium ha desarrollado un marco para simplificar el desarrollo de proyectos complejos en Unity, parte del cual está disponible públicamente en GitHub . Jedium planea reponer el repositorio con nuevos módulos de marco, así como soluciones de integración con Microsoft Azure.

Vitaliy Chashchin : desarrollador de software con más de 10 años de experiencia en el diseño e implementación de aplicaciones tridimensionales cliente-servidor, desde el concepto hasta la implementación e integración completas de aplicaciones y soluciones en el campo de la realidad virtual. Arquitecto de sistemas Jedium LLC, MSc en TI.

Alexey Sarafanov

Gerente de Marketing en Jedium LLC.

Sergey Kudryavtsev

CEO y fundador de Jedium LLC.

Source: https://habr.com/ru/post/es416343/


All Articles