Hola Habr! Les presento la traducción del artículo "Aprendizaje automático para cualquiera que haya tomado matemáticas en octavo grado" de Kyle Gallatin.

Por lo general, me doy cuenta de que la inteligencia artificial puede explicarse de una de dos maneras: a través del prisma cada vez más sensacional de varios medios, o a través de una densa literatura científica penetrada por un lenguaje excesivo y términos específicos del área.
Entre estos extremos, hay un área menos publicada donde, creo, la literatura debería ser un poco más activa. Las últimas noticias, como el estúpido robot Sophia , se entusiasman con la inteligencia artificial y pueden parecer algo así como una mente humana, mientras que en realidad Sophia no es más inteligente que SmarterChild de AOL Instant Messenger.
La literatura científica puede ser aún peor, obligando incluso al investigador más sofisticado a cerrar los ojos después de algunos párrafos de basura pseudointelectual sin sentido. Para evaluar adecuadamente la IA , las personas generalmente deben entender lo que realmente es. Y todo lo que necesita para comprender los conceptos básicos de la inteligencia artificial es un poco de matemática en la escuela secundaria.
Puedo ser propenso a la simplificación excesiva, y pediré a todos mis colegas en matemáticas, ciencia de datos e ingeniería que toleren mi explicación, a veces esto es lo que necesita la ciencia artística.
Fundamentos de Inteligencia Artificial y Aprendizaje Automático
La inteligencia artificial típica y clásica es todo lo que imita la inteligencia humana. Puede ser cualquier cosa, desde bots de videojuegos hasta plataformas complejas como Deepmind Alphago .

Ignorar el aprendizaje profundo: en este contexto, es lo mismo que el aprendizaje automático. Imagen: Mundo Geoespacial
El aprendizaje automático es un subconjunto de la inteligencia artificial. Esto permite que las máquinas "aprendan" de datos reales en lugar de actuar sobre un conjunto de reglas predefinidas.
Pero, ¿qué significa aprender? Puede que no sea tan futurista como parece.
Mi explicación favorita: el aprendizaje automático es solo en crack Si viste algo como Black Mirror , es bastante fácil comenzar a imaginar la inteligencia artificial moderna como un ser consciente: aquello que piensa, siente y toma decisiones difíciles. Esto es aún más común en los medios, donde la IA se personifica secuencialmente y luego se compara con Skynet de Terminator o la película The Matrix.
De hecho, esto no es así en absoluto. En su estado actual, la inteligencia artificial es solo matemática. A veces es matemática compleja, y a veces requiere un conocimiento profundo en el campo de la informática, estadística y otros. Pero al final, la IA moderna en su núcleo es solo una función matemática.
No se preocupe si no es amigo de las funciones matemáticas porque no las recuerda ni las utiliza. Para obtener la esencia, necesitamos recordar algunas cosas simples: hay una entrada ( ) y hay una salida ( ), y la función es lo que sucede entre la entrada y la salida: la conexión entre ellas.
Podemos hacer que la computadora mire la bandeja de entrada ( ) y saliente ( ) datos y descubrir qué los une.
Un ejemplo de inteligencia artificial super simplificada es una función expresada como . Ya lo sabemos y (de la tabla a continuación); solo necesitamos encontrar y para entender cuál es la relación entre y .
Tabla: Kyle Gallatin
Para que esta plantilla obtenga de necesitamos multiplicar en 1 ( ) y agregue 1 ( ) Entonces la función saldrá .
Genial Hemos determinado que y . Simplemente tomamos algunos datos (de la tabla anterior) y creamos una función que los describió. En esencia, esto es aprendizaje automático. Ahora, usando la función obtenida, podemos suponer qué será igual para otros datos de entrada .
La parte interesante es cómo le enseña a la máquina a encontrar qué función describe mejor los datos, pero cuando termina con ellos, lo que obtiene generalmente es de alguna forma . Una vez que obtengamos esta función, también podemos trazarla en un gráfico:

Captura de pantalla del video de Tecmath
Para una explicación más detallada de las funciones, Math Is Fun tiene un sitio intuitivo y simple (incluso si el nombre es una posible señal de alerta para usted, y el sitio parece que su diseñador web escapó en algún momento a principios de la década de 2000).
La gente no podrá contar, los automóviles podrán
Obviamente Es un ejemplo muy simple. La única razón por la que existe el aprendizaje automático es porque las personas no pueden ver millones de puntos de entrada y salida de datos y desarrollar una función compleja para describir los resultados. En cambio, podemos entrenar a la computadora para que haga esto por nosotros.
En cualquier caso, debe haber suficientes datos para encontrar la función correcta. Si solo tenemos un punto de datos para y , ni nosotros ni la máquina podríamos predecir solo una función exacta. En el ejemplo original, donde y la función puede ser , , o muchos otros Si no tenemos suficientes datos, la función que encuentra la máquina puede generar muchos errores cuando intentamos usarla para obtener más datos.
Además, los datos reales no siempre son tan perfectos. En el siguiente ejemplo, la máquina ha identificado varias funciones que corresponden a la mayoría de los datos, pero la línea no pasa por cada punto. A diferencia del ejemplo anterior con una tabla de una clase matemática, los datos recopilados del mundo real son más impredecibles y nunca se pueden describir completamente.

Este ejemplo básico muestra cómo una máquina aprende a describir mejor los datos presentados. Imagen: Hacia la ciencia de datos
Finalmente, lo último que la gente no puede hacer es mirar un montón de variables. Solo está usando y pero ¿y si hay más variables de entrada? Que pasa si afecta , , ... . Muy rápidamente, las funciones pueden volverse más complejas (para las personas).
Aprendizaje automático en el mundo real e inteligencia artificial.
Veamos un ejemplo real. Trabajo en el campo de los productos farmacéuticos, así que supongamos que tenemos un conjunto de datos relacionados con el cáncer que tiene dos variables de entrada que corresponden al tamaño del tumor: radio y perímetro, y salida, con dos valores posibles: si el tumor es benigno o metastásico (potencialmente peligroso de por vida). Puede parecer complicado, pero solo necesitamos aplicar un concepto familiar :
- es un diagnóstico y puede ser 0 (benigno) o 1 (metastásico).
- - radio
- - perímetro.
- Cada tienes tu desconocido ; vamos a llamarlos y .
- - constante desconocida.
¿Cómo se ve nuestra ecuación lineal ahora? No muy diferente del ejemplo anterior:
Como expliqué anteriormente, nos estamos moviendo más allá del alcance de las posibilidades humanas. Por lo tanto, en lugar de mirar los datos e intentar averiguar por qué deberíamos multiplicar nuestras variables, usamos máquinas. Lo harán por nosotros y obtendremos una evaluación precisa del diagnóstico. ¡Y esto es aprendizaje automático!
Por supuesto, incluso los datos multifactoriales más detallados no son ideales, por lo que nuestro modelo de aprendizaje automático tampoco será así. Pero no necesitamos que sean correctos en el 100% de los casos. Solo necesitamos que presenten la mejor función posible, que es adecuada para la mayoría de los casos.
Esta pieza solo rasca la superficie de las increíbles matemáticas e informática que se utilizan en el aprendizaje automático. Pero incluso a niveles complejos, el concepto es el mismo. No importa cuán impresionante o extraño pueda parecer el aprendizaje automático y la inteligencia artificial, todo proviene de las funciones que la máquina aprendió para describir mejor los datos.