O que a IA pode e não pode (por enquanto) fazer pelos seus negócios

A inteligência artificial é um alvo em movimento. E aqui está a melhor forma de apontar para isso.




A inteligência artificial (IA) parece nos cercar de todos os lados. Nós o encontramos em casa e no telefone. Ainda não temos tempo para perceber, de acordo com empreendedores e inovadores de negócios, como a IA estará presente em quase todos os produtos e serviços que compramos e usamos. Além disso, o escopo de sua aplicação na solução de problemas de negócios está crescendo aos trancos e barrancos. Ao mesmo tempo, crescem as dúvidas sobre as consequências do advento da IA; nos preocupamos com o modo como a automação afetará o local de trabalho, a disponibilidade de emprego e a sociedade.

Às vezes, a realidade se perde entre os medos e triunfos das manchetes que falam sobre Alexa, Siri e AlphaGo, porque as tecnologias de IA - aprendizado de máquina e seu subconjunto, aprendizado profundo - têm muitas limitações, cuja superação exigirá muito esforço. Este artigo descreve essas limitações e deve ajudar os diretores a entender melhor o que exatamente inibe suas tentativas de implementar a IA. Também descreveremos avanços promissores que visam remover algumas restrições e criar uma nova onda de oportunidades.

Nossas perspectivas dependem de uma combinação de trabalho de vanguarda - pesquisa, análise, avaliação de centenas de casos reais de uso - e colaboração com alguns pensadores avançados, cientistas e engenheiros que trabalham em áreas avançadas relacionadas à IA. Tentamos extrair a essência de sua experiência e ajudar diretores de empresas, que, como mostra nossa experiência, geralmente são guiados apenas por sua própria iniciativa e nem sempre entendem bem onde está a vanguarda ou o que já está disponível para a IA.

Simplificando, os problemas e as limitações da IA ​​criam um problema de "alvo em movimento" para os líderes: é difícil para eles chegarem à vanguarda, pois ela se move constantemente. Também é muitas vezes frustrante quando as tentativas de usar a IA tropeçam em barreiras do mundo real - isso pode diminuir a motivação para investimentos adicionais ou levar a um ponto de vista de "esperar para ver", enquanto outros continuarão avançando. Um estudo recente do McKinsey World Institute mostra que existe uma crescente lacuna entre líderes e aqueles que estão atrasados ​​no uso da IA ​​- e isso pode ser visto tanto na comparação de diferentes setores quanto dentro de cada um deles (Figura 1).


Figura 1: Os líderes de IA em um futuro próximo vão investir ainda mais nisso. Vertical: estimar o aumento nos gastos com IA em% nos próximos três anos; horizontal: porcentagem de empresas que já usam IA

Os diretores que tentam preencher a lacuna devem poder trabalhar com a IA de maneira informada. Em outras palavras, eles precisam entender não apenas em quais áreas a IA pode estimular inovação, idéias e tomada de decisões, levar a maiores lucros e eficiência - mas também onde a AI ainda não é capaz de ajudar. Além disso, eles devem aceitar o relacionamento e as diferenças entre as restrições técnicas e organizacionais - barreiras culturais, a falta de pessoal que possa criar soluções de IA prontas para os negócios e o problema da "última milha" de incorporar a IA em produtos e processos. Se você deseja se tornar um líder que entende alguns dos problemas técnicos críticos que atrasam o progresso da IA ​​e está pronto para aproveitar os desenvolvimentos promissores que podem superar essas limitações e potencialmente mudar o caminho do desenvolvimento da IA, continue lendo.

Desafios, limitações e oportunidades


Um ponto de referência útil será entender os recentes avanços na tecnologia de aprendizado profundo (GO). Esses são provavelmente os desenvolvimentos mais empolgantes no campo da IA ​​e alcançaram um aumento explosivo na eficiência nas classificações e previsões, sem a supervisão tradicional. O GO usa redes neurais em grande escala capazes de conter milhões de "neurônios" simulados distribuídos em camadas. As opções de rede mais comuns são chamadas de redes neurais convolucionais (SNA) e redes neurais recorrentes (RNS). Essas redes neurais são treinadas usando dados de treinamento e algoritmos de retropropagação .

Embora progressos impressionantes tenham sido feitos nessa área, ainda há muito a ser feito. O momento crítico é ajustar a IA a uma tarefa específica e aos dados disponíveis. Como esses sistemas não são programados, mas treinados, vários processos de seu trabalho para a execução exata de tarefas complexas geralmente exigem uma quantidade enorme de dados marcados. Obter um grande conjunto de dados pode ser complicado. Em algumas áreas, elas simplesmente podem não existir, mas, mesmo que existam, a rotulagem pode levar uma enorme quantidade de recursos humanos.

Além disso, nesses modelos, pode ser difícil decifrar como um modelo matemático, treinado com a ajuda do GO, chega a uma certa previsão, recomendação ou solução. A utilidade de uma caixa preta, mesmo que cumpra seu objetivo, pode ser limitada, especialmente nos casos em que suas previsões ou decisões afetam a comunidade e têm consequências relacionadas à saúde humana. Nesses casos, o usuário geralmente precisa saber "por que" - por exemplo, como exatamente o algoritmo chegou a essas recomendações - se suas ações podem ter consequências legais ou regulamentares. Por que certos fatores, e não outros, foram críticos neste caso.

Vamos examinar cinco fatores inter-relacionados nos quais essas limitações e as opções emergentes para contorná-las começam a desempenhar um papel.

Limite 1: marcação de dados


A maioria dos modelos modernos de IA treina usando o "aprendizado supervisionado". Isso significa que as pessoas devem marcar e categorizar os dados de origem - e esse trabalho pode ser difícil e propenso a erros. Por exemplo, as empresas de robôs estão contratando centenas de pessoas para marcar manualmente muitas horas de vídeo para ajudar a treinar esses sistemas. Ao mesmo tempo, novas tecnologias promissoras aparecem - por exemplo, controle de streaming (demonstrado por Eric Horvitz e colegas da Microsoft Research), no qual os dados podem ser marcados durante o uso natural. Abordagens não controladas ou parcialmente controladas reduzem a necessidade de conjuntos de dados grandes e rotulados. Duas técnicas promissoras são o treinamento por reforço e uma rede geradora-competitiva .

Treinamento reforçado. Essa técnica de aprendizado não supervisionado permite que os algoritmos aprendam simplesmente por tentativa e erro. A metodologia usa o método da cenoura e da vara: para cada tentativa de concluir uma tarefa, o algoritmo recebe uma recompensa (por exemplo, uma pontuação alta) se seu comportamento for bem-sucedido ou a punição de outra forma. Com um aumento no número de repetições, a eficiência também aumenta e, em muitos casos, excede as capacidades humanas - desde que o ambiente de aprendizado corresponda ao mundo real.

O aprendizado reforçado é famoso por usar jogos de computador no ensino de computadores - recentemente, os GPs também foram incorporados a esse esquema. Em maio de 2017, por exemplo, ajudou o sistema AlphaGo AI a vencer o campeão mundial Ke Ze no jogo go. Como outro exemplo, a Microsoft começou a fornecer serviços que se beneficiam de aprendizado reforçado e se adaptam às preferências do usuário. A aplicação potencial do aprendizado reforçado é adequada para vários tipos de empresas. Entre as possibilidades estão: negociação de valores mobiliários usando IA, que ganha ou perde pontos por adquirir ou perder financiamento; mecanismo de recomendações de produtos, recebendo pontos para cada venda realizada na recomendação; O software que cria rotas para o transporte de carga recebe uma recompensa pela entrega pontual ou pelo consumo reduzido de combustível.

O aprendizado reforçado também pode ajudar a IA a transcender as limitações naturais e sociais da marcação humana, desenvolvendo soluções que ninguém havia pensado antes e estratégias que mesmo jogadores experientes nunca pensaram em usar. Recentemente, por exemplo, o sistema AlphaGo Zero, usando um treinamento de reforço de um novo tipo, derrotou seu antecessor AlphaGo aprendendo a jogar do zero. Significava começar com um jogo completamente aleatório consigo mesmo, em vez de praticar em jogos disputados por pessoas e com pessoas.

Redes generativo-adversárias (GSS). Nesse modelo de treinamento com controle parcial, duas redes competem entre si para melhorar e refinar sua compreensão de um determinado conceito. Por exemplo, para reconhecer como são os pássaros, uma rede tenta encontrar as diferenças entre imagens reais e falsas de pássaros, e seu concorrente tenta enganá-lo emitindo imagens muito semelhantes às imagens de pássaros, mas não aquelas. Quando duas redes começam a desenhar, a representação do pássaro em cada modelo se torna mais precisa.

A capacidade do GSS de fornecer exemplos de dados cada vez mais plausíveis pode reduzir significativamente a necessidade de as pessoas marcarem conjuntos de dados. Por exemplo, para treinar o algoritmo de reconhecimento de tumores em imagens médicas, milhões de imagens rotuladas por pessoas geralmente seriam necessárias para indicar os tipos e estágios do desenvolvimento do tumor. Usando o GSS, treinado para produzir imagens cada vez mais realistas de vários tipos de tumores, os pesquisadores podem treinar o algoritmo de reconhecimento de tumores, combinando um banco de dados muito menor de dados rotulados por pessoas com a saída do GSS.

Embora o uso do GSS para o diagnóstico preciso de doenças ainda esteja longe de ser implementado, os pesquisadores já estão começando a usá-lo em contextos cada vez mais complexos. Isso inclui: entender e produzir obras de arte no estilo de um artista em particular; o uso de imagens de satélite e o reconhecimento de características geográficas para criar mapas relevantes de territórios em rápido desenvolvimento.

Limite 2: obtenha conjuntos de dados de treinamento em massa


Já foi demonstrado que tecnologias simples de IA que usam modelos lineares, em alguns casos, podem se aproximar das capacidades de médicos especialistas em outros campos. A atual onda de aprendizado de máquina, no entanto, requer conjuntos de dados de treinamento - não apenas rotulados, mas também em grande número, além de abrangentes. Os métodos GO exigem que milhares de registros compilem modelos relativamente bons, capazes de classificação e, em alguns casos, milhões de registros para se aproximar do nível de uma pessoa.

A dificuldade é que esses conjuntos de dados maciços podem ser difíceis de obter ou criar em muitos casos comerciais. Cada pequena alteração na tarefa pode exigir outro grande conjunto de dados e novo treinamento. Por exemplo, treinar um veículo autônomo para se deslocar em um local de mineração, onde o clima geralmente muda, pode exigir um conjunto de dados que inclui várias condições ambientais que a máquina pode encontrar.

A técnica de aprendizado one-shot pode reduzir a necessidade de grandes conjuntos de dados e permitir que o modelo de IA aprenda os recursos do objeto com um pequeno número de demonstrações ou exemplos reais (em alguns casos, até um). Os recursos da IA ​​se aproximarão de uma pessoa que possa reconhecer com precisão os vários representantes da mesma categoria depois que se familiarizar com apenas um exemplo - por exemplo, com uma caminhonete. Nesta metodologia, que ainda está em desenvolvimento, os cientistas primeiramente treinam modelos preliminarmente em realidade virtual simulada, na qual existem opções para a tarefa ou, no caso do reconhecimento de padrões, uma imagem de um objeto. Então, depois que os modelos demonstrarem várias opções para o objeto no mundo real, que a IA não viu na realidade virtual, ele usará o conhecimento existente para encontrar a solução certa.

Esse tipo de treinamento de uma só vez pode, como resultado, ajudar a criar um sistema que verifica textos quanto à violação de direitos autorais ou reconhece um logotipo corporativo em um vídeo depois de se familiarizar com apenas um exemplo. Hoje, essas aplicações estão em seus estágios iniciais. Mas sua utilidade e eficácia podem expandir rapidamente as possibilidades de uso da IA ​​em vários setores.

Limitação 3: o problema da explicabilidade


A explicabilidade não é um problema novo para os sistemas de IA. Mas cresce junto com os sucessos e a adoção da defesa civil, por causa dos quais não apenas a variedade de aplicações está aumentando, mas também sua opacidade. Quanto maior e mais complexo o modelo, mais difícil é explicar em termos humanos por que essa ou aquela decisão foi tomada (isso é ainda mais difícil se tudo acontecer em tempo real). Essa é uma das razões pelas quais o uso de certas ferramentas de IA não está se expandindo tanto em áreas onde a explicabilidade é útil ou mesmo necessária. Além disso, com a expansão do escopo da IA, os requisitos dos reguladores também podem aumentar a necessidade de modelos de IA com um alto nível de explicabilidade.

Duas abordagens promissoras nascentes para aumentar a transparência dos modelos são explicações agnósticas de modelo interpretável local (LIMEs) e técnicas de atenção (figura 2). O LIME tenta determinar em quais partes dos dados de entrada o modelo treinado baseia principalmente seus cálculos para desenvolver um modelo intermediário e interpretável. Essa técnica analisa vários segmentos de dados ao mesmo tempo e observa como as previsões mudam para ajustar o modelo intermediário e desenvolver uma interpretação mais precisa (por exemplo, excluindo os olhos em vez do nariz para verificar qual deles é mais importante para o reconhecimento de face). As técnicas de atenção visualizam as partes dos dados de entrada em que o modelo se baseia para tomar uma decisão específica (por exemplo, concentrando-se na boca para determinar se uma pessoa está na figura).


Anexo 2

Outra tecnologia usada há algum tempo são os modelos aditivos generalizados (OAM). Usando modelos com um recurso, o OAM limita a interação dos recursos, resultando em que cada um deles se torna mais interpretável para os usuários. Espera-se que a adoção dessas e de outras tecnologias que buscam remover a cortina de mistério da IA ​​ajude muito a aumentar o uso da IA.

Limite 4: generalização da aprendizagem


Ao contrário dos humanos, os modelos de IA dificilmente transferem sua experiência de um conjunto de circunstâncias para outro. De fato, tudo o que o modelo alcançou em uma aplicação específica permanece aplicável apenas a este caso. Como resultado, as empresas precisam gastar recursos constantemente no treinamento do próximo modelo, embora as tarefas para sua aplicação sejam muito semelhantes.

Uma resposta promissora para esse desafio é o aprendizado portátil. Nesta abordagem, o modelo de IA é treinado para resolver um problema específico e, em seguida, aplica rapidamente esse treinamento a um trabalho semelhante, mas diferente. Pesquisadores do DeepMind mostraram resultados promissores com a transferência de aprendizado em experimentos em que o treinamento usando realidade virtual foi transferido para controlar membros robóticos reais.

O aprendizado portátil e outras abordagens genéricas estão evoluindo e podem ajudar as organizações a criar rapidamente novas maneiras de aplicar e adicionar novas funcionalidades aos métodos existentes e de trabalho. Por exemplo, ao criar um assistente virtual, o treinamento portátil pode generalizar as preferências do usuário de uma área (digamos, música) para outra (digamos, para livros). Os casos de uso não se limitam a produtos digitais. O treinamento portátil pode ajudar, por exemplo, uma empresa de petróleo e gás a expandir o uso de algoritmos de IA treinados em serviços preditivos de poço para outros equipamentos, como oleodutos e plataformas de perfuração. O treinamento portátil, mesmo em princípio, pode revolucionar a análise de negócios: imagine uma ferramenta de IA que analise dados e entenda como otimizar os lucros das companhias aéreas, capaz de adaptar seu modelo às mudanças no clima ou nas economias locais.

Outra abordagem é usar algo que descreva aproximadamente a estrutura generalizada aplicada a vários problemas. Por exemplo, o AlphaZero, do DeepMind, usou a mesma estrutura em três jogos diferentes: foi possível usar essa estrutura generalizada para treinar um modelo de um jogo de xadrez em um dia, para que mais tarde vencesse o programa campeão mundial.

Por fim, imagine as possibilidades de técnicas de meta-aprendizado nascentes tentando automatizar o desenvolvimento de modelos de aprendizado de máquina. Por exemplo, a equipe do Google Brain usa o AutoML para automatizar o desenvolvimento de redes neurais para classificar imagens em conjuntos de dados em larga escala. Hoje, essas técnicas funcionam tão bem quanto as desenvolvidas por seres humanos. Esse desenvolvimento parece promissor, principalmente devido ao fato de muitas organizações experimentarem uma escassez de funcionários talentosos. Também é possível que a meta-aprendizagem exceda as capacidades humanas e melhore os resultados. É importante entender que essas tecnologias ainda estão nos estágios iniciais de desenvolvimento.

Limite 5: polarização de dados e algoritmos


Até o momento, focamos nas limitações que podem ser superadas por métodos técnicos já em desenvolvimento, alguns dos quais descrevemos. Viés é um tipo diferente de problema. Consequências sociais potencialmente destrutivas podem nos esperar quando vícios humanos (conscientes ou inconscientes) determinarão quais dados usar e quais ignorar. Além disso, quando o processo e a frequência da coleta de dados variam dependendo de diferentes grupos e comportamentos, pode-se esperar problemas com a forma como os algoritmos analisarão esses dados, aprenderão com eles e farão previsões. Entre as conseqüências adversas: decisões sobre a contratação de funcionários com base em informações erradas, previsões médicas ou científicas distorcidas, modelos financeiros incorretos e decisões em casos criminais,e decisões legais erradas. Em muitos casos, esse viés permanece não detectado ou ignorado sob o pretexto de "ciência avançada de dados", "dados e algoritmos proprietários" ou "análise objetiva".

Ao implantar algoritmos de aprendizado de máquina e de IA em novas áreas, podemos encontrar novas manifestações desses problemas de viés que surgem em conjuntos de dados e algoritmos. E eles geralmente ficam lá, porque para reconhecê-los e tomar medidas para eliminá-los, você precisa entender profundamente a tecnologia de trabalhar com dados e as interações sociais existentes, incluindo o processo de coleta de dados. Em geral, o viés é um dos obstáculos mais difíceis e, certamente, o mais socialmente pesado.

Agora, existem muitas pesquisas, tanto teóricas quanto na coleta de dados sobre os melhores métodos de uso da IA, tentando resolver os problemas descritos nos campos acadêmico, não comercial e privado. E já é tempo - esse problema provavelmente se tornará cada vez mais crítico e suscitará mais e mais perguntas. Considere, por exemplo, o fato de que muitas dessas abordagens preditivas baseadas em aprendizado e estatística assumem tacitamente que o futuro é como o passado. E o que faremos no ambiente sociocultural quando as ações que tomarmos a mudarem - e onde a tomada de decisões com base no comportamento passado pode desacelerar o progresso (ou, pior ainda, desenvolver resistência à mudança)? Muitos líderes, incluindo líderes de negócios,Em breve, talvez seja necessário encontrar respostas para essas perguntas.

Como acertar um alvo em movimento


Pode levar anos para encontrar soluções para as limitações descritas e espalhar a implementação comercial dos desenvolvimentos avançados indicados aqui. Mas uma variedade empolgante de recursos relacionados à IA sugere que a imaginação pode ser a maior limitação da IA. Aqui estão algumas dicas para os líderes que tentam estar na vanguarda, ou pelo menos acompanhar as tendências de ponta.

Aprenda novas informações, adapte-se, acompanhe.


Embora a maioria dos diretores da empresa não precise saber a diferença entre redes neurais convolucionais e recorrentes, você precisa estar familiarizado com os recursos das ferramentas modernas, ter uma noção geral de quando podem ocorrer descobertas a curto prazo e ver as perspectivas do que está além do horizonte. Entreviste seus especialistas em dados e aprendizado de máquina, converse com os pioneiros da IA ​​para se adaptar ao conhecimento atual, participe de algumas conferências da AI para obter informações sobre fatos reais; Os artigos de notícias podem ser úteis, mas também podem fazer parte do hype. Outra boa maneira de acompanhar os novos desenvolvimentos é a pesquisa realizada por especialistas experientes, como o AI Index (um projeto do grupo Centennial AI Research ) "de Stanford).

Comece a usar uma sofisticada estratégia de dados.


Os algoritmos de IA precisam ajudar a revelar novas idéias à espreita nos dados gerados pelo seu sistema. Eles podem ser ajudados desenvolvendo uma estratégia abrangente de dados que se concentra não apenas nas tecnologias necessárias para coletar dados de sistemas individuais, mas também na disponibilidade de dados, o sistema para recebimento, marcação e gerenciamento. E, embora as novas tecnologias prometam reduzir a quantidade de dados necessários para treinar os algoritmos de IA, o treinamento controlado, exigindo grandes quantidades de dados, continua sendo a tecnologia predominante. E mesmo as tecnologias destinadas a minimizar a quantidade necessária de dados ainda precisam de algum tipo de dado. Portanto, o ponto principal de tudo isso será um conhecimento preciso dos seus próprios dados e a melhor forma de usá-los.

Pense fora da caixa.


As técnicas de transferência de transferência ainda estão engatinhando, mas sempre há a oportunidade de obter soluções usando a IA em várias áreas, e não apenas em uma. Se você resolveu um problema como a manutenção preditiva de equipamentos em um grande armazém, essa solução pode ser aplicada a produtos de consumo? Posso usar dicas eficazes do que mais comprar em vários canais de distribuição de produtos? Incentive os departamentos da empresa a compartilharem conhecimentos que possam revelar maneiras de usar as melhores soluções e idéias de IA em várias áreas da empresa.

Torne-se um inovador.


Manter-se atualizado com as modernas tecnologias de IA e casos de uso não é suficiente para permanecer competitivo a longo prazo. Convença seus especialistas em processamento de dados ou convide especialistas externos para resolver um problema útil com a ajuda de tecnologias emergentes - como as mencionadas neste artigo. Sempre descubra o que pode ser feito e o que se tornou disponível. Muitas ferramentas, conjuntos de dados e modelos de aprendizado de máquina treinados para aplicativos padrão (incluindo reconhecimento de fala, visão e emoção) agora estão disponíveis para o usuário em geral. Às vezes, eles estão disponíveis na forma de projetos com código-fonte; em outros casos, por meio de interfaces de software (APIs) criadas pelos principais pesquisadores e empresas. Cuidado com esses recursos,eles podem ajudá-lo a perceber os benefícios para os pioneiros.

As perspectivas para a IA são enormes, e as tecnologias, ferramentas e processos necessários para traduzir essas promessas em ação ainda não estão totalmente preparados. Se você acha que pode esperar, deixe a tecnologia tomar forma e use-a com êxito uma das primeiras - pense novamente. É muito difícil saltar de uma posição em pé, especialmente se o alvo se move muito rapidamente e você não entende o que as modernas tecnologias de IA podem ou não fazer. E enquanto pesquisadores e pioneiros no campo da IA ​​se preparam para resolver os problemas mais agudos de hoje, é hora de começar a entender o que está acontecendo na vanguarda da IA, para que você possa configurar sua organização corretamente e ajudá-la a aprender novas oportunidades, usá-las e até promovê-las. próximo.

Source: https://habr.com/ru/post/pt410443/


All Articles