Inteligencia artificial, fuerte y no muy
Del 4 al 7 de abril, se celebró en San José una conferencia organizada por NVIDIA, dedicada a la computación paralela y la inteligencia artificial. A continuación, me gustaría compartir mis pensamientos sobre el estado y las perspectivas de desarrollos en el campo de la IA, inspirados por este evento.El razonamiento sobre la inteligencia artificial se puede dividir en dos tipos. El primer tipo está hablando de lo que sucederá cuando aparezcan las computadoras y cuál será el destino de la especie humana. Explora las posibles opciones para la relación del hombre y la máquina de pensar. Se discuten los temas de inmortalidad relacionados con la posible transferencia de la conciencia humana al caparazón de la computadora. Quizás se plantea la cuestión principal: si una persona crea una mente muy superior a la suya, ¿quién será con esta mente? ¿El maestro, el esclavo, la rama sin salida de la evolución o un participante en la simbiosis?El segundo tipo es una discusión sobre las formas, que, en teoría, deberían conducir a la creación de inteligencia artificial y métodos completos que ahora ayudan a resolver problemas intelectuales complejos.La cuenca principal pasa por el "criterio de racionalidad" de las máquinas. Esto se llama la división de la inteligencia artificial en fuerte y débil. La IA débil significa la capacidad de las computadoras para resolver problemas de información, por ejemplo, para determinar lo que se muestra en la imagen o para traducir el sonido de una voz al texto correspondiente. Una IA fuerte implica que una computadora no solo opera con información, sino que, en un grado u otro, comprende su significado. Por ejemplo, si un traductor de computadora de un idioma a otro simplemente reemplaza una palabra por otra de acuerdo con reglas predeterminadas sin cambios, entonces esta es una IA débil, pero si proviene de comprender el significado de las frases, entonces ya está más cerca de ser fuerte.El criterio para una IA fuerte es la famosa prueba de Turing. Si, mientras se comunica con una computadora a través de un canal de comunicación anónimo, no puede entender quién está al otro lado de la línea, una persona o una máquina, entonces podemos suponer que esa computadora interlocutora realmente piensa. La esencia de esta prueba es que cuántos no recuerdan las respuestas que las personas dan a ciertas preguntas y cuántos no acumulan frases que son relevantes en ciertos momentos, siempre habrá una situación en la que será imposible una respuesta "mecánica".Un ejemplo reciente de "no pasar la prueba" es un chatbot de Microsoft Tay. Podrías chatear con él a través de Twitter o los mensajeros Kik y GroupMe. Después de un día de comunicación con los usuarios, el bot del chat se volvió agresivo, comenzó a alabar a Hitler y regañar a los judíos.
La razón de este comportamiento no es en absoluto que las personas que hablan con él "le hayan abierto los ojos a la vida". La razón: hasta ahora, la incapacidad de las máquinas se acercará a comprender el significado de las frases. Cuando el chatbot recuerda algo similar a la conversación actual, puede usar las frases que la gente dijo en tales situaciones, con la esperanza de obtener algo razonable. O el robot puede intentar determinar el tema de la conversación, por ejemplo, por cuánto las palabras y las palabras utilizadas por el interlocutor aconsejan uno u otro tema. Una vez determinado el tema de la conversación, puede intentar seleccionar frases de conversaciones con un tema similar o utilizar el conocimiento en esta área incrustado o extraído de Internet. Esta estrategia le permite crear la apariencia de una conversación razonable, pero solo visibilidad. Aunque, quizás esto no sea malo. A veces en una empresa después de la quinta o sexta vez,cuando no es necesario que la comunicación escuche atentamente a la persona con la que está hablando, y si en este momento alguien es reemplazado por un chatbot, entonces quizás esto no se notará de inmediato.Significativamente mejor que hablar sobre un tema gratuito, las computadoras pueden comprender comandos y consultas formalizadas. Si la máquina espera un tratamiento muy específico, entonces la tarea se simplifica enormemente. De acuerdo con este principio, tanto Siri como Ok, Google funcionan con éxito.Hubo mucha actividad en la conferencia dedicada a la supercomputadora IBM Watson. La idea principal de Watson es comprender la conversación en un lenguaje natural, traducirla en una descripción amigable para la computadora, usar bases de conocimiento en varios campos para encontrar respuestas adecuadas.
¡En febrero de 2011, Watson ganó el programa de televisión Jeopardy! (La contraparte rusa es "Mi juego"). Además, venció no solo a sus rivales, sino a dos poseedores de récords, Brad Rutter, el dueño de la mayor victoria en el programa, y Ken Jennings, poseedor del récord durante la serie de ganar-ganar. La computadora ganó un premio de $ 1 millón. NVIDIA bromeó acerca de ganar diciendo que no saben qué hará la computadora con un millón, pero desde el punto de vista del método de entrenamiento de refuerzo, hay que decir que este es un buen refuerzo. Se observó especialmente que Watson estaba en igualdad de condiciones con los jugadores en el sentido de que no estaba conectado a Internet. En memoria de Watson, "todo el Internet" se cargó por adelantado, al menos una parte significativa del tamaño de 4 terabytes. Para datos estructurados, esto es bastante, es suficiente tener en cuenta que toda la Wikipedia toma 17 gigabytes.
Lo más importante en el juego fue que las preguntas se hicieron sin ninguna simplificación y aclaraciones adicionales. Esto significa que, en algunos casos, la computadora pudo determinar correctamente lo que se requería de ella y encontrarla en su base de conocimiento. Pero, ¿comprendió realmente Watson la esencia de las preguntas formuladas? No, no lo entendí, al menos no en la forma en que la gente entiende. ¿Cuál fue la esencia de la pelea? La gente entendió todas las preguntas formuladas, pero no siempre pudo encontrar la respuesta en su memoria. La computadora no entendió el significado de las preguntas, pero, utilizando algoritmos, las tradujo a un determinado formulario de búsqueda, mediante el cual encontró una coincidencia bastante precisa en su memoria estructurada. La victoria de Watson mostró que el algoritmo más la buena memoria pueden dar un mayor porcentaje de respuestas correctas que la comprensión y la falta de memoria.Si las personas tuvieran acceso a Internet y no establecieran un marco de tiempo ajustado, el resultado del juego sería diferente.IBM Watson aún no se puede atribuir a una IA fuerte, pero esto no resta valor a sus méritos. El principal problema asociado con la comprensión del lenguaje natural es la multiplicidad de interpretaciones que pueden ocurrir en la misma palabra dependiendo del contexto de la frase. Pero si la conversación entra en un área más especial, resulta que muchas áreas determinan casi las únicas interpretaciones posibles. Y en este punto, el éxito de la computadora aumenta significativamente. Al darse cuenta de esto, los desarrolladores de Watson se centraron en temas individuales. Por ejemplo, quizás el mayor avance de la supercomputadora de IBM está relacionado con el diagnóstico médico. Watson le da una conversación sobre un tema médico en un lenguaje natural con bastante facilidad, ya que todo lo dicho se interpreta exclusivamente en un sentido médico. Con una enorme base de datos de registros médicos,de diagnósticos y cursos de tratamiento, la computadora pudo mostrarse a nivel de buenos médicos, y en algunas áreas, por ejemplo, en oncología, a un nivel excelente. Esto no significa que los médicos vivos ahora deben ser ignorados, sino que debe entenderse para que los médicos tengan una valiosa oportunidad de verificar sus hallazgos u obtener ideas adicionales consultando con Watson. Traeré la bicicleta al tema.Moscú Mediados de los ochenta.Una conferencia médica sobre el uso de computadoras en medicina. Todos los participantes acordaron que pronto las computadoras reemplazarán a los médicos ... Harán diagnósticos y las personas solo tendrán medidas de procedimiento.Y al final de la conferencia, un médico muy anciano expresó el deseo de hablar, además, de un académico y profesional. Con fuertes aplausos, apenas subió al podio ... Los elementos de la fiesta presentes en el evento consideraron que el apoyo de tal innovación por parte de un médico respetado sería una buena señal ... Salió y dijo: “A principios de los años veinte, una esposa muy importante fue llevada a mi maestro para su examen. Comisario del pueblo del partido. Este fue un caso muy difícil, ocho médicos anteriores no pudieron diagnosticar al paciente. Una mirada a esta mujer fue suficiente para mi maestro; él inmediatamente ordenó un análisis de la reacción de Wasserman. Entonces, queridos colegas, ¿qué tipo de computadora puede diagnosticar la sífilis instantáneamente en un solo tipo de paciente *?Volviendo a Watson. IBM ha tomado el camino de la creaciónUna API abierta donde cualquiera puede usar el conocimiento y la interfaz de lenguaje natural de Watson para integrarse en su negocio. IBM está tratando de crear muchos servicios cognitivos como reconocimiento de voz e imagen, un servicio de clasificación de consultas en un idioma natural, traducción a otro idioma, determinar el color emocional del habla y los textos, etc. En el futuro, ven que muchas compañías podrán transferir la mayor parte de su atención al cliente de voz a la tecnología de Watson, y esto ofrece enormes ahorros. En resumen, muchos indios de los centros de llamadas pueden quedar sin trabajo.La idea de que la IA comienza a funcionar mucho mejor cuando es posible pasar a una tarea especial que reduce el espacio de interpretación es aplicable no solo al análisis del lenguaje natural, sino también, por ejemplo, al análisis de imágenes. En principio, esta es la base para construir un sistema de control de automóvil sin conductor. Cuando el sistema de visión artificial se muestra una imagen, y determina lo que hay en esta imagen, entonces la determinación se produce con cierta probabilidad. Y sobre un perro con una capa de tigre, el sistema puede decir que es un tigre. Todo es más fácil en el camino, la cantidad de objetos que se pueden encontrar no es grande, lo que significa que la elección y las interpretaciones son muy limitadas: un peatón, automóvil, autobús, señal de tráfico, marcas, pero no un tigre, ni una ballena ni un pastel de bodas.El control de vehículos no tripulados utiliza muchas tecnologías, estas son algunas de ellas:- Reconocimiento de patrones, es responsable de reconocer varios objetos en el camino;
- Al procesar una serie de imágenes con un desplazamiento, le permite seleccionar objetos individuales contra el fondo de otros;
- El procesamiento de imágenes estereoscópicas le permite construir un mapa de profundidad y distancia;
- El uso de lidar complementa la construcción de un mapa de distancia o le permite construirlo desde cero, por ejemplo, en completa oscuridad. El otro día, Ford se distinguió ;
- Capacitación reforzada, brinda capacitación sobre manejo y normas de manejo.
En el salón de la conferencia había tres vehículos no tripulados de Audi, Volvo y BMW. Todos ellos, y no solo ellos, tienen el control integrado en la solución NVIDIA DRIVE . La solución en sí consta de tres componentes:- NVIDIA DRIVE PX - plataforma de piloto automático;
- NVIDIA DRIVE CX: una computadora de a bordo con un sistema de navegación, si PX sabe cómo ir, entonces CX sabe a dónde ir y cómo entretener al pasajero;
- NVIDIA DIGITS DEV BOX es un sistema de aprendizaje profundo que le permite entrenar redes neuronales para PX.

La conducción automática causa una fuerte impresión. AI en todo su esplendor. Me gustó especialmente el video que mostró Toyota sobre cómo aprender a conducir su automóvil no tripulado. Al principio, él, como un gatito ciego, hurgaba en todas las direcciones y frenaba constantemente, luego se movía con más confianza y, finalmente, después de 3000 millas de carrera, comenzó a correr con bastante confianza en cualquier camino.
Toyota estuvo representado en la conferencia a través del Instituto de Investigación Toyota. El CEO del Instituto, Gill Pratt, anunció que el fabricante de automóviles tiene la intención de invertir $ 1 mil millones en los próximos cinco años en investigación relacionada con la IA. El enfoque de Toyota es interesante. Dicen que no consideran que el piloto automático completo sea una prioridad. Ahora el piloto automático, implementado, por ejemplo, en Tesla, requiere el modo "manos en el volante". Es decir, puede conducir, pero requiere un control constante por parte del conductor. Este modo es bastante molesto que agrega placer al viaje. Toyota se enfoca en los sistemas de asistencia al conductor, es decir, el piloto automático no interfiere con el control mientras todo va bien, pero si la situación se descontrola, el piloto automático toma todo en sus propias manos y salva la situación. Pocos conductores tienen experiencia conduciendo en situaciones extremas,la conducción normal tiene poco que ver con qué hacer en una situación crítica. El piloto automático puede estar muy bien entrenado precisamente para tales casos. 1,200,000 muertes en carreteras anualmente, tales estadísticas en el planeta Tierra. Según Toyota, su sistema reducirá esta cifra a casi cero. Como recuerda Gill Pratt (recuerdo): "La demanda de nuestro sistema no debe considerarse para los automóviles, los consumidores que lo necesitan desesperadamente son 1.200.000 personas al año"."La demanda de nuestro sistema no debe considerarse para los automóviles, los consumidores que lo necesitan desesperadamente son 1,200,000 personas al año"."La demanda de nuestro sistema no debe considerarse para los automóviles, los consumidores que lo necesitan desesperadamente son 1,200,000 personas al año".Pero un piloto automático, no importa cuán sorprendente pueda parecer un automóvil que viaja sin conductor, no es una IA fuerte. Hasta ahora, este es un conjunto de buenos métodos y algoritmos. Es posible que no se necesite más para esta tarea.Muchas tareas, como la conducción no tripulada, se pueden resolver con éxito sin utilizar una IA fuerte. Las redes neuronales con aprendizaje profundo (o aprendizaje profundo, si le gusta la traducción de Aprendizaje profundo) son bastante adecuadas cuando la “programación en la frente” se detiene y resulta que es mucho más fácil “alimentar” una red neuronal con una gran variedad de ejemplos y temas de capacitación. por lo tanto, enseñarle la clasificación correcta que tratar de describir todos los patrones y reacciones a ellos.Pero los milagros no suceden, la simplicidad de obtener un resultado se compensa con la complejidad del entrenamiento. El entrenamiento de una red neuronal de una gran cantidad de elementos en una gran cantidad de ejemplos requiere una gran cantidad de cómputo. Las CPU tradicionales son demasiado lentas para tales cálculos. La única salvación es la paralelización masiva de los cálculos, ya que las redes neuronales son muy buenas en esto. Las GPU que se crearon originalmente para formar imágenes gráficas eran casi perfectas para tales fines. La demanda en el mercado de redes neuronales obligó a los fabricantes de GPU a tener en cuenta las características de una aplicación de este tipo en la arquitectura del hierro y los impulsó a crear un software apropiado que facilita la vida de los desarrolladores. En la conferencia, NVIDIA, como el principal fabricante de GPU, trató de convencer a todosque crearon una pila completa de software necesario, proporcionando el soporte de todas las etapas del desarrollo de redes neuronales.Como ya escribí , en la conferencia, NVIDIA presentó un avance en el campo del entrenamiento de redes neuronales profundas: la supercomputadora DGX-1. Un avance es un aumento de 12 veces en la productividad en las tareas de aprendizaje en comparación con sus predecesores.
En consecuencia, el ecosistema incluye no solo hierro, sino también un conjunto completo de programas optimizados para el aprendizaje profundo (https://developer.nvidia.com/deep-learning#source=pr).El paquete de software DGX-1 incluye el sistema de entrenamiento de GPU NVIDIA Deep Learning (DIGITS), un sistema interactivo completo para crear redes neuronales profundas (DNN), así como una biblioteca acelerada por GPU de primitivas para crear DNN: la red neuronal profunda NVIDIA CUDA (cuDNN) versión 5 .Además, el sistema contiene versiones optimizadas de varios marcos de aprendizaje profundo ampliamente utilizados: Caffe, Theano y Torch. DGX-1 también proporciona acceso a herramientas de administración basadas en la nube, actualizaciones de software y un banco de aplicaciones de contenedores ”.En general, en la conferencia, NVIDIA claramente trató de transmitir a todos la idea de que durante mucho tiempo no solo han sido fabricantes de chips especializados, sino una compañía que tiene una visión de la tecnología en general y ofrece soluciones integradas en las que el hierro es solo uno y no el hecho de que la mayoría componente principalEn resumen, la IA avanza a pasos agigantados. Pero por ahora, todo esto es una IA débil. El término débil no debe tomarse como una evaluación negativa. Esto es solo un refinamiento de la tecnología utilizada. Es fácil juzgar cuán lejos estamos de una IA fuerte por los sistemas de traducción por computadora. Mientras se traduce el texto técnico u otro texto bien interpretado, el traductor automático está a la altura. Pero vale la pena dar un ejemplo que requiere una comprensión del significado de la frase, cómo la traducción correcta se convierte en una casualidad y no hay métodos estadísticos que salven la situación.Deep Blue de IBM ganó un juego de ajedrez de 6 juegos en 1997 contra el campeón mundial Garry Kasparov. AlphaGo de Google recientemente derrotó al jugador Go más fuerte del mundo. ¿Cuánto indica esto que se acerca una era de IA fuerte? Un gran paso para un robot, pero poco progreso para la humanidad. Vemos un buen trabajo de métodos de enseñanza con refuerzo, pero con un significativo "pero". El hecho es que tanto el ajedrez como el Go permiten una descripción bastante simple y precisa de la posición. La estrategia de comportamiento se basa en el entendimiento de que la posición nos es familiar en un grado u otro y que podemos usar la experiencia que hemos adquirido para tomar decisiones. Para no calcular todas las opciones, se introduce una evaluación de la calidad de la situación hasta el final, que le permite evaluar la posición sin calcular las opciones para una posible continuación. En ambas situaciones, resultalo más importante es poder obtener todos los elementos semánticos que influyen en su evaluación a partir de una descripción formal de un puesto. Para el ajedrez y el Guo, aunque esto no es fácil, funcionó. En la vida, todo es mucho más complicado. Una descripción "cruda" externa de lo que está sucediendo no ayuda mucho a determinar una estrategia de comportamiento y evaluar la calidad de una situación. No se puede juzgar la similitud de situaciones por la coincidencia de algunos de los signos. Requiere una comprensión del significado de lo que está sucediendo. Cualquier detalle menor puede ser crítico para determinar lo que está sucediendo. Por lo tanto, google-mobile continuará conduciendo por la carretera si no hay obstáculos, no se violan las normas de tráfico y se sigue la ruta. Y no se sentirá confundido ni por el hongo nuclear en el horizonte, ni por las multitudes de zombis nerviosamente al margen.pero resultó En la vida, todo es mucho más complicado. Una descripción "cruda" externa de lo que está sucediendo no ayuda mucho a determinar una estrategia de comportamiento y evaluar la calidad de una situación. No se puede juzgar la similitud de situaciones por la coincidencia de algunos de los signos. Requiere una comprensión del significado de lo que está sucediendo. Cualquier detalle menor puede ser crítico para determinar lo que está sucediendo. Por lo tanto, google-mobile continuará conduciendo por la carretera si no hay obstáculos, no se violan las normas de tráfico y se sigue la ruta. Y no se sentirá confundido ni por el hongo nuclear en el horizonte, ni por las multitudes de zombis nerviosamente al margen.pero resultó En la vida, todo es mucho más complicado. Una descripción "cruda" externa de lo que está sucediendo no ayuda mucho a determinar una estrategia de comportamiento y evaluar la calidad de una situación. No se puede juzgar la similitud de situaciones por la coincidencia de algunos de los signos. Requiere una comprensión del significado de lo que está sucediendo. Cualquier detalle menor puede ser crítico para determinar lo que está sucediendo. Por lo tanto, google-mobile continuará conduciendo por la carretera si no hay obstáculos, no se violan las normas de tráfico y se sigue la ruta. Y no se sentirá confundido ni por el hongo nuclear en el horizonte, ni por las multitudes de zombis nerviosamente al margen.Cualquier detalle menor puede ser crítico para determinar lo que está sucediendo. Por lo tanto, google-mobile continuará conduciendo por la carretera si no hay obstáculos, no se violan las normas de tráfico y se sigue la ruta. Y no se sentirá confundido ni por el hongo nuclear en el horizonte, ni por las multitudes de zombis nerviosamente al margen.Cualquier detalle menor puede ser crítico para determinar lo que está sucediendo. Por lo tanto, google-mobile continuará conduciendo por la carretera si no hay obstáculos, no se violan las normas de tráfico y se sigue la ruta. Y no se sentirá confundido ni por el hongo nuclear en el horizonte, ni por las multitudes de zombis nerviosamente al margen.Crear una IA fuerte está directamente relacionado no solo con la capacidad de operar algorítmicamente (usando métodos tradicionales) con información, sino también con la capacidad de comprender su significado. Esta tarea parece difícil, especialmente porque está directamente relacionada con la comprensión del trabajo del cerebro, ya que este mecanismo es capaz de trabajar con significado. ¿Pronto vendrá una IA fuerte? Quizás muy pronto. En el próximo artículo describiré el desarrollo de nuestro grupo con respecto a la formalización matemática del concepto de significado y la construcción de un modelo basado en esto, que afirma tener una muy buena descripción del cerebro, y que muestra de manera convincente una buena muestra de trabajo. Entonces, tal vez pronto en la tienda escuche ese diálogo:Vendedor: Esta es una novedad, un implante cerebral, elimina la mitad de la carga mental.Comprador: ¡Genial! Véndeme un par.Source: https://habr.com/ru/post/es393071/
All Articles