Olá Habr! Apresento a você a tradução do artigo "Aprendizado de máquina para quem fez matemática na oitava série", de Kyle Gallatin.

Costumo notar que a inteligência artificial pode ser explicada de duas maneiras: através do prisma cada vez mais sensacional de várias mídias, ou através da densa literatura científica penetrada por linguagem excessiva e termos específicos da área.
Entre esses extremos, há uma área menos publicada, onde, eu acho, a literatura deve ser um pouco mais ativa. Notícias de última hora, como o estúpido robô Sophia , exageram na inteligência artificial e podem parecer algo como uma mente humana, enquanto na realidade Sophia não é mais inteligente que o SmarterChild do AOL Instant Messenger.
A literatura científica pode ser ainda pior, forçando até o pesquisador mais sofisticado a fechar os olhos depois de alguns parágrafos de lixo pseudo-intelectual sem sentido. Para avaliar adequadamente a IA , as pessoas geralmente precisam entender o que realmente é. E tudo o que você precisa para entender o básico da inteligência artificial é um pouco de matemática no ensino médio.
Eu posso estar propenso a simplificar demais - e pedirei a todos os meus colegas de matemática, ciência de dados e engenharia que tolerem minha explicação - às vezes é isso que a ciência artística precisa.
Fundamentos de Inteligência Artificial e Aprendizado de Máquina
A inteligência artificial clássica e típica é tudo o que imita a inteligência humana. Pode ser qualquer coisa, desde bots de videogame a plataformas complexas como o Deepmind Alphago .

Ignorar o Deep Learning - nesse contexto, é o mesmo que o aprendizado de máquina. Imagem: Mundo geoespacial
O aprendizado de máquina é um subconjunto de inteligência artificial. Isso permite que as máquinas “aprendam” com dados reais, em vez de agir sobre um conjunto de regras predefinidas.
Mas o que significa aprender? Pode não ser tão futurista quanto parece.
Minha explicação favorita: o aprendizado de máquina é apenas no crack. Se você assistiu a algo como Black Mirror , é muito fácil começar a imaginar a inteligência artificial moderna como um ser consciente - aquilo que pensa, sente e toma decisões difíceis. Isso é ainda mais comum na mídia, onde a IA é personificada sequencialmente e, em seguida, comparada à Skynet, do Terminator, ou ao filme Matrix.
De fato, isso não é verdade. No seu estado atual, a inteligência artificial é apenas matemática. Às vezes, é matemática complexa e, às vezes, exige um profundo conhecimento no campo da ciência da computação, estatística e outros. Mas, no final, a IA moderna é apenas uma função matemática.
Não se preocupe se você não é amigo das funções matemáticas porque não as lembra ou as utiliza. Para entender o essencial, precisamos lembrar apenas de algumas coisas simples: existe uma entrada ( ) e existe uma saída ( ) e a função é o que acontece entre a entrada e a saída - a conexão entre elas.
Podemos fazer o computador olhar para a caixa de entrada ( ) e de saída ( ) e descubra o que os une.
Um exemplo de inteligência artificial super simplificada é uma função expressa como . Nós já sabemos e (da tabela abaixo); só precisamos encontrar e para entender qual é a relação entre e .
Tabela: Kyle Gallatin
Para que este modelo obtenha de precisamos multiplicar em 1 ( ) e adicione 1 ( ) Então a função sairá .
Ótimo! Determinamos que e . Nós apenas pegamos alguns dados (da tabela acima) e criamos uma função que os descreveu. Em essência, isso é aprendizado de máquina. Agora, usando a função obtida, podemos assumir o que será igual para outros dados de entrada .
A parte interessante é como você ensina a máquina a descobrir qual função melhor descreve os dados, mas quando você termina, o que você obtém geralmente é de alguma forma . Quando obtemos essa função, também podemos plotá-la em um gráfico:

Captura de tela do vídeo Tecmath
Para uma explicação mais detalhada das funções, o Math Is Fun possui um site intuitivo e simples (mesmo que o nome seja uma bandeira vermelha em potencial para você e o site pareça que seu web designer escapou em algum momento no início dos anos 2000).
As pessoas não serão capazes de contar, os carros serão capazes de
Obviamente É um exemplo muito simples. A única razão pela qual o aprendizado de máquina existe é porque as pessoas não podem olhar para milhões de pontos de entrada e saída de dados e criar uma função complexa para descrever os resultados. Em vez disso, podemos treinar o computador para fazer isso por nós.
De qualquer forma, deve haver dados suficientes para encontrar a função correta. Se tivermos apenas um ponto de dados para e , nem nós nem a máquina podíamos prever apenas uma função exata. No exemplo original, onde e função pode ser , , ou muitos outros. Se não tivermos dados suficientes, a função que a máquina encontra pode levar a muitos erros quando tentamos usá-la para obter mais dados.
Além disso, dados reais nem sempre são tão perfeitos. No exemplo abaixo, a máquina identificou várias funções que correspondem à maioria dos dados, mas a linha não passa por cada ponto. Diferente do exemplo anterior, com uma tabela de uma classe matemática, os dados coletados do mundo real são mais imprevisíveis e nunca podem ser totalmente descritos.

Este exemplo básico mostra como uma máquina aprende a melhor descrever os dados apresentados. Imagem: Rumo à ciência de dados
Finalmente, a última coisa que as pessoas não podem fazer é examinar várias variáveis. Está apenas usando e mas e se houver mais variáveis de entrada? E se afeta , , ... . Muito rapidamente, as funções podem se tornar mais complexas (para as pessoas).
Aprendizado de máquina do mundo real e inteligência artificial
Vejamos um exemplo real. Eu trabalho no campo de produtos farmacêuticos, então suponha que tenhamos um conjunto de dados relacionados ao câncer que possua duas variáveis de entrada que correspondam ao tamanho do tumor - raio e perímetro e saída, com dois valores possíveis: se o tumor é benigno ou metastático (potencialmente perigoso pela vida). Pode parecer complicado, mas só precisamos aplicar um conceito familiar :
- é um diagnóstico e pode ser 0 (benigno) ou 1 (metastático).
- - raio.
- - perímetro.
- Cada tem o seu desconhecido ; vamos chamá-los e .
- - constante desconhecida.
Como é a nossa equação linear agora? Não é muito diferente do exemplo acima:
Como expliquei acima, estamos indo além do escopo das possibilidades humanas. Assim, em vez de olhar para os dados e tentar descobrir o que devemos multiplicar nossas variáveis, usamos máquinas. Eles farão isso por nós e obteremos uma avaliação precisa do diagnóstico. E isso é aprendizado de máquina!
Obviamente, mesmo os dados multifatoriais mais detalhados não são ideais, portanto nosso modelo de aprendizado de máquina também não será assim. Mas não precisamos que eles estejam corretos em 100% dos casos. Só precisamos que eles apresentem a melhor função possível, adequada para a maioria dos casos.
Esta peça apenas arranha a superfície da incrível matemática e ciência da computação que entra no aprendizado de máquina. Mas, mesmo em níveis complexos, o conceito é o mesmo. Não importa o quão impressionante ou estranho o aprendizado de máquina e a inteligência artificial possam parecer, tudo vem das funções que a máquina aprendeu para melhor descrever os dados.