Software de IA aprende a fazer IA: cientistas relatam sucesso em inteligência artificial de auto-aprendizado


Segundo Kurzweil, a escala logarítmica de mudanças de paradigma para os principais eventos históricos mostra uma tendência exponencial: o

elemento-chave para o surgimento da singularidade tecnológica é o lançamento de um ciclo descontrolado de auto-aperfeiçoamento da IA, em que cada nova geração mais inteligente de IA aparecerá mais rapidamente que a anterior. De acordo com a teoria da singularidade de Wernor Wing, como resultado do desenvolvimento explosivo da inteligência, a superinteligência aparecerá no ciclo de auto-aperfeiçoamento exponencial, que excederá em muito as capacidades da mente humana e, de fato, será incompreensível para ele. São chamadas várias datas aproximadas do início da singularidade, baseadas na extrapolação do progresso tecnológico. Ray Kurzweil acredita que isso acontecerá por volta de 2045 (embora ele não considere o auto-aperfeiçoamento exponencial da IA ​​obrigatório), e o valor médio médio de uma pesquisa de especialistas em IA forte é 2040.

É possível que a singularidade ocorra antes do previsto. Os engenheiros do Google e desenvolvedores de sistemas de IA de outras empresas relatam os sucessos alcançados em uma direção fundamental - a criação de sistemas de IA projetados para projetar outros sistemas de IA.

Em um experimento, os pesquisadores de inteligência artificial do Google Brain desenvolveram um programa que projetou a arquitetura neural da rede neural, para que apresentasse os melhores resultados em reconhecimento de fala. Um sistema projetado por um método de software mostrou um resultado melhor do que as redes neurais criadas pelo homem .

Edição da MIT Technology Review relatório para o de sistemas de inteligência artificial para criar o sucesso nos últimos meses para a concepção de outros sistemas de inteligência artificial relatado por vários grupos de pesquisa, incluindo a organização sem fins lucrativos OpenAI (financiado por Elon Musk), Instituto de Tecnologia de Massachusetts , da Universidade da Califórnia em Berkeley, bem como outra divisão de inteligência artificial no Google - DeepMind . Obviamente, esta área de pesquisa científica é considerada uma das mais promissoras, muitos querem ter sucesso nela.

De acordo com a MIT Technology Review, esses desenvolvimentos buscam principalmente um objetivo econômico. Criar um programa para projetar aplicativos de IA acelerará bastante o uso de tais tecnologias em vários setores da economia. Agora, muitas empresas não podem se dar ao luxo de implementar um sistema de IA, porque não existe um especialista com essa competência no estado. Banalmente, os especialistas em IA são escassos. Mas as redes neurais podem ser usadas em quase um grande número de aplicações: na indústria automotiva, no setor bancário, nas telecomunicações, nos sistemas de segurança e videovigilância, em uma variedade de produtos de consumo para reconhecimento de voz e gestos, visão de máquina, etc.

O desenvolvimento de sistemas de IA por métodos de programa substituirá alguns desses programadores escassos.

Também é importante que a IA desenvolva redes neurais mais eficientes que os seres humanos, para que a introdução de tais programas faça sentido mesmo onde os desenvolvedores vivos costumavam trabalhar.

Jeff Dean, chefe da equipe de pesquisa do Google Brain, discutiu recentemente esse tópico. Em seu discurso na conferência AI Frontiers , em Santa Clara, Califórnia, ele sugeriu que alguns desses programadores possam ser substituídos por software, porque no momento as empresas precisam pagar muito dinheiro e salários a esses especialistas, que são extremamente carentes.

Por exemplo, no artigo científico " Aprendendo a aprender sobre reforço“O DeepMind descreve um conjunto de experimentos para IA de autoaprendizagem, que os pesquisadores chamam de“ aprendizado profundo de meta-reforço ”. rede neural desenvolvido o seu próprio livre de modelos externos com procedimento de aprendizado por reforço para a outra rede neural recorrente.

Experimentos têm mostrado que a rede neural de segunda ordem, criado pelos esforços da primeira rede neural, em alguns casos, Rep demonstra a eficácia e qualidade, que não tem rede neural de primeira ordem.

No total, o trabalho científico do DeepMind descreve sete desses experimentos. Como sempre, eles os gastam no espaço de jogos de computador. Segundo os pesquisadores, esses agentes de IA criados usando outros programas de IA são capazes de se adaptar mais rapidamente a novas tarefas, usando o conhecimento adquirido anteriormente em tarefas semelhantes. Os experimentos também mostraram que o resultado do treinamento de IA de segunda ordem pode ser considerado imprevisível: sua arquitetura não depende da arquitetura da IA ​​de primeira ordem e pode ser muito diferente dela. Em particular, a IA de segunda ordem é capaz de usar recursos ambientais que não eram conhecidos ou não levados em consideração pelos próprios desenvolvedores.

Os especialistas da DeepMind acreditam que seus experimentos com meta-treinamento profundo com reforço também são importantes no estudo do cérebro humano, em particular, eles "fornecem uma estrutura integradora para a compreensão dos respectivos papéis da dopamina e do córtex pré-frontal nos processos de aprendizado biológico com reforço".

A idéia de IA de autoaprendizagem foi apresentada antes, mas até agora, os cientistas não foram capazes de demonstrar resultados tão impressionantes. Por exemplo, um dos pioneiros nesse campo, o professor Yoshua Bengio, disse que esses experimentos exigem muito poder computacional, de modo que, até recentemente, não faziam sentido. Por exemplo, nas experiências do Google Brain, 800 GPUs de alto desempenho foram usadas para executar software que cria um sistema de IA para visão de máquina.

Pesquisadores do Instituto de Tecnologia de Massachusetts planejam publicar o código fonte do programa que eles usaram em seus experimentos. Talvez com o tempo, o uso de tais ferramentas faça sentido em termos econômicos e reduza o ônus para os especialistas que desenvolvem modelos para processamento de dados. Programadores altamente qualificados serão capazes de escapar da codificação e se concentrar em idéias de ordem superior.

Source: https://habr.com/ru/post/pt400965/


All Articles