👩🏽‍🤝‍👩🏻 🧑🏾 👨‍👨‍👧 El loro ha aterrizado. El anuncio del libro "Aprendizaje profundo generativo" 👨🏾‍🎓 👨🏿‍🎨 ♋️

Hola colegas

Nos complace anunciar que nuestros planes de publicación para el comienzo del próximo año incluyen un excelente libro nuevo de Aprendizaje Profundo Generativo de David Foster

El autor, comparando este trabajo no menos con el aterrizaje de Apolo en la luna, publicó en Medium una revisión detallada de su obra maestra, que proponemos considerar un avance cercano a la realidad.

¡Disfruta leyendo, sigue el anuncio!

Mi viaje de 459 días del blog al libro y viceversa

20:17 UTC, 20 de julio de 2019

50 años antes, minuto por minuto: el módulo Eagle fue pilotado, pilotado por Neil Armstrong y Buzz Aldrin. Fue la manifestación más elevada de ingeniería, coraje y determinación genuina.

Avance rápido 50 años, y descubra que toda la potencia de procesamiento de la computadora de control a bordo (AGC) de la nave espacial Apollo , que llevó a estas personas a la luna, ahora cabe en su bolsillo muchas veces. De hecho, la potencia informática del iPhone 6 traería simultáneamente a la luna 120 millones de naves espaciales como la Apollo 11.

Este hecho no resta valor a la grandeza de la AGC. Según la ley de Moore, puede tomar cualquier dispositivo informático y no confundirse, diciendo que en 50 años habrá una máquina que puede funcionar 2²⁵ veces más rápido.

Margaret Hamilton, la directora del equipo de programadores que escribió el código para AGC, consideró las limitaciones de hardware de las computadoras de esa época no como un obstáculo, sino como un desafío. Ella utilizó todos los recursos a su disposición para lograr lo impensable.

Margaret Hamilton y código para el AGC (fuente: Science History Images)

Y ahora, quiero contarte sobre ...

El libro "Aprendizaje profundo generativo"

Hace 459 días, recibí una carta de O'Reilly Media, preguntándome lo interesante que sería escribir un libro. Entonces me gustó esta idea, así que acepté y decidí escribir la guía más actualizada para el modelado generativo, o más bien, un libro práctico que le diga cómo crear modelos de aprendizaje profundo tradicionales que puedan dibujar, escribir textos, componer música y jugar .

Lo más importante es que, después de leer este libro, me gustaría que el lector entienda en detalle el aprendizaje profundo generativo e intente crear modelos que sean cosas realmente sorprendentes; Además, estos modelos no requieren recursos informáticos enormes y costosos, que aún funcionan con bastante lentitud.
Estoy profundamente convencido: para aprender cualquier tema técnico, debe comenzar resolviendo pequeños problemas al respecto, pero comprenderlos con tanto detalle que comprenda la razón de todas las líneas de código para una sola.
Si comienza con grandes conjuntos de datos y con tales modelos, cada uno de los cuales lleva un día entero y no una hora de ejecución, entonces no aprenda nada más allá del mínimo: solo pase 24 veces más tiempo en entrenamiento.

Lo más importante que nos enseñó el aterrizaje de Apolo en la luna es que puedes lograr resultados absolutamente sorprendentes con recursos informáticos muy modestos. Exactamente la misma impresión que tendrá sobre el modelo generativo después de leer mi libro.

¿Qué le pasa al loro?

Escribir para O'Reilly es aún más agradable ya que seleccionan ilustraciones animales para la portada de su libro. Obtuve un loro de cabeza roja y cola azul, que bauticé como Neil Wingstrong en un ataque de sentimientos.

Neil Wingstrong es de la familia Parrot.

Entonces, el loro ha aterrizado. ¿Qué se debe esperar del libro?

¿De qué trata este libro?

Este libro es una guía aplicada al modelado generativo.

Establece todas las cosas básicas que ayudan a construir los modelos generativos más simples. Luego, el material gradualmente se vuelve más complejo para los modelos más avanzados, paso a paso. Todas las secciones van acompañadas de ejemplos prácticos, diagramas arquitectónicos y códigos.
Este libro es para todos los que quieran comprender mejor la próxima exageración sobre el modelado generativo. Leer un libro no requiere conocimientos de aprendizaje profundo, todos los ejemplos de código se dan en Python.

¿Qué se considera en el libro?

Traté de cubrir en el libro todos los desarrollos clave en el campo del modelado generativo en los últimos 5 años. Resulta tal escala.

El libro está dividido en dos partes, a continuación se ofrece una breve descripción de los capítulos:

Parte 1: Introducción al aprendizaje profundo generativo

El propósito de los primeros cuatro capítulos del libro es presentarle las técnicas clave que necesitará para comenzar a construir los modelos generativos del aprendizaje profundo.

1. Modelado generativo

En un contexto amplio, consideraremos la disciplina del modelado generativo y el tipo de tareas que estamos tratando de resolver utilizando un enfoque probabilístico. Luego examinamos nuestro primer ejemplo del modelo generativo probabilístico probabilístico más simple y analizamos por qué puede ser necesario recurrir a métodos de aprendizaje profundo en caso de complicación de la tarea generativa.

2. Aprendizaje profundo

Este capítulo lo ayudará a navegar por las herramientas y técnicas de aprendizaje profundo que necesita para comenzar a crear modelos generativos más complejos. Aquí conocerá Keras , un marco para la construcción de redes neuronales que puede ser útil para construir y capacitar algunas de las arquitecturas de redes neuronales profundas ultramodernas que se analizan en la literatura.

3. Codificadores automáticos de variación

En este capítulo, veremos nuestro primer modelo para el aprendizaje profundo generativo: el codificador automático variacional. Este poderoso enfoque nos ayudará a generar caras realistas desde cero y a cambiar las imágenes existentes; por ejemplo, agregar una sonrisa a nuestras caras o cambiar el color de nuestro cabello.

4. Redes de contención generativa (GAN)

Este capítulo analiza una de las variedades más exitosas de modelado generativo que ha surgido en los últimos años: la red generativa competitiva. Basado en este hermoso marco para estructurar las tareas de modelado generativo, se construyen muchos de los modelos generativos más avanzados. Consideraremos cómo se puede ajustar y por qué nos permite expandir constantemente los límites de lo que se puede lograr mediante el modelado generativo.

Parte 2: Enseñamos a las máquinas a dibujar, escribir, componer música y tocar

La Parte 2 presenta casos que lo ayudan a comprender cómo se pueden usar las técnicas de modelado generativo para resolver problemas específicos.

5. Dibujo

Este capítulo trata dos técnicas relacionadas con el dibujo de máquina. Primero, discutiremos la red neuronal CycleGAN, que, como su nombre lo indica, es una adaptación de la arquitectura GAN, que permite que el modelo aprenda cómo convertir una foto en una pintura escrita con cierto estilo (o viceversa). También hablaremos sobre la técnica de transferencia neural incorporada en muchas aplicaciones móviles de edición de fotos, que ayuda a transferir el estilo de la imagen a la foto para crear la impresión de que esta foto es solo otra de las imágenes del mismo artista.

6. Escribir textos

En este capítulo, pasamos a textos escritos a máquina; en esta área temática, uno tiene que enfrentar otros desafíos que cuando se generan imágenes. Aquí aprenderá sobre las redes neuronales recurrentes (RNN), una arquitectura que es conveniente para resolver problemas asociados con los datos en serie. También discutiremos cómo funciona la arquitectura del codificador-decodificador y escribiremos el generador de preguntas y respuestas nosotros mismos.

7. Componiendo música

Este capítulo está dedicado a la generación de música, y esta tarea también está relacionada con la generación de datos en serie. Pero, a diferencia de escribir textos, en este caso hay dificultades adicionales, por ejemplo, el modelado de timbres y ritmos musicales. Nos aseguraremos de que muchas de las técnicas utilizadas para generar el texto sean aplicables en esta área temática, así como también exploraremos la arquitectura de aprendizaje profundo llamada MuseGAN, que adapta las ideas del capítulo 4 (sobre GAN) a los datos musicales.

8. El juego

Este capítulo describe cómo los modelos generativos son compatibles con otras áreas del aprendizaje automático, incluido el aprendizaje reforzado. Discutiremos uno de los artículos científicos más interesantes publicados recientemente, que se llama 'Modelos mundiales' (Modelos del mundo). Los autores de este artículo muestran cómo el modelo generativo puede usarse como un entorno en el que el agente está entrenado, de hecho, le permite al agente "pensar" posibles escenarios futuros e imaginar qué sucederá si se toman ciertas acciones, y todo esto está completamente dentro del contexto de nuestro concepto conceptual. Modelos ambientales.

9. El futuro del modelado generativo.

Aquí resumimos el panorama tecnológico actual del modelado generativo y miramos hacia atrás, recordando algunas de las técnicas presentadas en este libro. También hablaremos sobre cómo las arquitecturas de redes neuronales más modernas disponibles en la actualidad, por ejemplo, GPT-2 y BigGAN, pueden cambiar nuestras ideas sobre la actividad creativa. Me pregunto si alguna vez será posible crear un sistema artificial que pueda generar obras indistinguibles de muestras de arte visual humano, literatura y música.

10. Conclusión

Reflexiones finales sobre por qué el aprendizaje profundo generativo puede convertirse en una de las áreas tecnológicas más importantes en el aprendizaje profundo en los próximos 5-10 años.

Resumen

En un mundo donde cada vez es más difícil distinguir la realidad de la ficción, el trabajo de los ingenieros que entienden en detalle los principios del trabajo de los modelos generativos y no temen las posibles limitaciones tecnológicas se vuelve vital.

Espero que mi libro lo ayude a dar los primeros pasos para comprender estas últimas tecnologías y también se convierta en una lectura interesante y agradable para usted.

El loro ha aterrizado. El anuncio del libro "Aprendizaje profundo generativo"

More articles: