Existem habilidades, mas não há razão: tarefas que a IA não pode lidar com

"O carro precisa decidir quem sacrificar - aqueles que estão dentro do carro ou aqueles que correram ao volante", Tatyana Gavrilova, professora do Departamento de Tecnologia da Informação da Universidade Estadual de São Petersburgo, explica quais algoritmos estão subjacentes à inteligência artificial e quais dificuldades seus desenvolvedores enfrentam.

Do cérebro vivo à inteligência artificial


Nos últimos cinco anos, uma grande onda de publicações, discursos, medos e hype - discussões, hype e publicidade agressiva aumentaram em torno da inteligência artificial. Isso indica principalmente especulação e palavrões. Os portais de notícias competindo entre si contam como uma rede neural aprendeu outro truque incrível. Deve-se entender que uma rede neural artificial não é um modelo do cérebro. Os neurofisiologistas observam que o mecanismo do cérebro ainda é pouco conhecido e seu modelo está longe de ser formalizado em matemática.

Em 2013, a Comissão Europeia avaliou o projeto de pesquisa Human Brain Project e alocou um subsídio de US $ 1 bilhão para pesquisa. O objetivo deste projeto é criar um modelo de computador totalmente funcional do cérebro humano. Apresente a complexidade do cérebro: como os neurônios se conectam e interagem, como as memórias são formadas e as decisões são tomadas. Na Conferência Europeia em 2019, foi feita uma apresentação pelo neurocientista, diretor e fundador do The Human Brain Project, Henry Markram. Ele e a equipe mostraram imagens do cérebro, iluminadas em um tomógrafo de diferentes lados, enfatizando que quanto mais se aprofundavam no cérebro, menos fica claro como ele funciona. Todo esse tempo eles estiveram se movendo no caminho da miniaturização, mas é óbvio que é necessário um macro-modelo do cérebro. Aqui você pode fazer uma analogia com a conhecida metáfora: não importa o quanto a formiga se arraste dentro da TV, ela ainda não entende que tipo de dispositivo é.

Os chatbots falam, mas não entendem


O primeiro programa de conversação "Eliza" foi desenvolvido nos anos 60. Seu trabalho foi como uma sessão de psicoterapia. Um exemplo de diálogo pode ser assim:
Olá. Como você está se sentindo
- Minha cabeça dói.
- Com que frequência isso acontece?
"Toda vez que eu falo com minha mãe."
"Você tem um problema com sua mãe." Conte-nos mais sobre isso.

O programa contém um conjunto de espaços em branco. Identifica a palavra-chave em cada frase e cria a ilusão de conversa, sem qualquer significado. Assim, Eliza poderia habilmente manter uma conversa por várias horas, causando boa impressão nas pessoas.

A Alice da Yandex de hoje é a mesma Elisa, com uma plataforma de serviços conectada e um vocabulário muito mais rico. Toda a inteligência de tais bots de bate-papo se resume a reciclagem. Se marcarmos para eles as respostas são ruins, inadequadas, então elas serão eliminadas no futuro e deixarão boas que sejam adequadas. A real racionalidade do programa, sua capacidade não apenas de determinar o que é mostrado na figura ou de converter a fala oral em texto, mas de entender o significado da informação e pensar, só aparecerá quando conectada a uma base de conhecimento. Esta é uma certa compreensão da ordem mundial. Nenhum programa pode fazer isso ainda. A inteligência artificial que trabalha com uma base de conhecimento é chamada AI simbólica (AI simbólica).

Agora, duas direções são usadas ativamente: rede neural artificial e aprendizado de máquina. Seu desenvolvimento não é realizado em laboratórios científicos sob a orientação de cientistas, mas em empresas de TI. Programadores e desenvolvedores de redes neurais artificiais admitem que não há nada pensando além do cérebro. Portanto, se eles querem criar um sistema inteligente, são forçados a simular o cérebro, porque não há mais nada. Mas uma inovação fundamental será para aqueles que são capazes de cruzar modelos de representação do conhecimento e aprendizado de máquina.
A propósito, algumas empresas já estão usando ativamente robôs para a colocação de empregos. Eles são especialmente bons em rastreios em massa, que recebem mais de 1000 currículos. O robô analisa os questionários e avalia os candidatos quanto à relevância, mas a decisão final ainda é tomada pela pessoa. Cientistas do Instituto de Tecnologia da Geórgia descobriram em que casos as pessoas confiam de bom grado no robô. Isso acontece se for informado com antecedência que ele foi projetado para executar uma tarefa específica. Esses robôs também realizam entrevistas de fim de semana. As pessoas têm um diálogo mais franco com a máquina sobre os motivos da demissão e sobre as dificuldades que encontraram no processo de trabalho. Assim, os robôs coletam feedback muito bom e, o mais importante, significativo. Além disso, as pessoas têm medo de mentir para um robô. Eles acham que os carros têm mais informações. Por exemplo, as duas principais perguntas para selecionar lojistas foram: você tem antecedentes criminais e bebe álcool? E as pessoas sem se esconderem responderam a essas perguntas ao robô.

O que há de errado com os drones


Os veículos não tripulados modernos são imperfeitos e têm várias desvantagens. O mais óbvio está na visão de máquina. A questão não é sequer na esfera técnica; o problema da visão de máquina não foi resolvido conceitualmente. Câmeras e sensores processam certos sinais com grande velocidade, como resultado das imagens binárias na memória do computador, que devem ser interpretadas. Essa é a principal dificuldade. Se, por exemplo, um pedestre atravessa a rua, qualquer motorista o considera facilmente. Não porque sua visão é melhor que a da câmera de um drone, mas porque o motorista tem um modelo de pessoa em movimento em sua mente. Modelos de visão ainda não existem. Não se sabe como uma pessoa processa informações visuais. Estão sendo projetados dispositivos de modelagem que permitem, com um certo grau de confiança, reconhecer vários objetos.

Imagine que você pediu a uma pessoa que não entende nada nos carros para trazer o osso da sorte. Obviamente, ele não será capaz de fazer isso. Porque ele não é mecânico de automóveis e não tem um modelo de alavanca na cabeça. Mas se você diz que este é um pedaço de ferro de forma curva - uma pessoa o trará. Todo mundo sabe o que é um pedaço de ferro e entende como é uma "forma curvada". Mesmo após a explicação, o robô não aguenta. Para fazer isso, você precisa treiná-lo, estabelecendo os conceitos de todos esses objetos de diferentes ângulos e com diferentes graus de acesso.

Enquanto estiver no escritório, uma pessoa não precisa afastar a cadeira da mesa para identificar o item. Basta olhar para as costas. Somente porque as pessoas têm um modelo completo da cadeira e nós, em uma parte dela, recriamos o todo. Sabemos que uma cadeira é um atributo essencial do interior de um escritório. Portanto, a partir de uma grande variedade de objetos que podem ser recriados a partir desse fragmento, selecionamos um. Não há programas universais que possam fazer isso. Atualmente, nenhuma inteligência artificial contém um modelo do mundo e conhecimento que lhe permita interpretar sem ambiguidade a imagem que vê.

Suponha que, em algum lugar atrás dos arbustos, um homem se escondeu, pronto para correr para a estrada. Parte do corpo está escondida atrás de uma densa folhagem. A parte visível não será suficiente para que a máquina considere isso como um perigo potencial. Além disso, se você vê um elefante escondido atrás dos arbustos, provavelmente decide que este é um homem com uma máscara de elefante, porque em nossa área não são encontrados elefantes. Bem, o carro certamente não tem esse conhecimento.

O problema das interpretações está se aproximando de sua resolução, em qualquer caso, há progresso. No algoritmo de aprendizado de máquina em grandes amostras, você pode colocar 100 carros, e é claro que 101, mesmo de uma marca diferente, com alta probabilidade, o programa reconhecerá corretamente. Embora este carro não seja especificamente estabelecido nele. Também é importante notar que, para o treinamento do programa, é importante observar a variedade de seleção. Se, por exemplo, você aprender apenas o programa em sedans, e um conversível subir, provavelmente não o reconhecerá, porque não havia carros sem teto na amostra.

O segundo desafio é um dilema ético no qual uma máquina precisa fazer uma escolha moral. Digamos que veículos não tripulados transportem passageiros. Um homem pulou para se encontrar, e a única maneira de evitar uma colisão era entrar em um pilar próximo. O carro deve decidir quem sacrificar - aqueles que estão dentro do carro ou aqueles que correram sob as rodas. Esta é uma tarefa absolutamente insolúvel para ela. Já existem primeiros acidentes e até vítimas. No Arizona, um SUV não tripulado de propriedade da Uber atingiu um pedestre até a morte. A culpa é deles que eles lançaram um algoritmo bruto que não passou em todos os testes na pista.

O problema dos drones é, antes de tudo, a falta de idéias básicas sobre o mundo. As pessoas sempre tomam decisões no contexto. Nenhuma inteligência artificial tem uma imagem completa do mundo que uma pessoa tem aos 18 anos. Por esse motivo, uma carteira de motorista é emitida precisamente a partir dos 18 anos [na Rússia], embora a visão já esteja bem formada aos 14 anos. Antes de atingir a idade adulta, uma pessoa não pode tomar decisões informadas, inclusive éticas e emocionais.

Estamos lidando com algoritmos muito jovens e imaturos que requerem refinamento. Eles são capazes de funcionar corretamente, mas exclusivamente sob controle humano.

Inteligência Artificial Poligráfica


No mercado de inteligência artificial, as principais empresas do mundo estão investindo ativamente no campo da computação emocional. Essa tecnologia revela as mudanças mais invisíveis nas expressões faciais. O programa seleciona um certo número de pontos no rosto e o compara com o banco de dados de fotografias em que a emoção já é reconhecida.

A Microsoft disse que eles têm um algoritmo semelhante, mas não o entregará ao governo. Esta é uma ferramenta muito perigosa que pode ser usada contra seres humanos. Imagine que você entra no escritório do chefe, e ele vê que você o odeia e pensa mal dele. Existe um sério problema ético.

Haverá muitos outros programas similares de "reconhecedores". Bonito, maravilhoso inclusive. Eles serão úteis, especialmente em medicina. Os carros já estão ajudando os médicos a diagnosticar doenças. Digamos que o programa americano IBM Watson faça diagnósticos de diagnóstico melhores do que alguns médicos iniciantes. Como amostra de treinamento, seis mil histórias de casos foram colocadas nele. Este é um trabalho titânico e, é claro, muito dinheiro.

A máquina sabe compor


A máquina não é capaz de gerar algo qualitativamente novo. Letras originais, versos, composições musicais - tudo isso se baseia no princípio da permutação, ou, mais simplesmente, na permutação. Quanto à poesia, o algoritmo de ações é o seguinte: o programa encontra momentos comuns e certas combinações. Ele pega palavras-chave, adiciona as palavras de outros autores e as torce no ritmo desejado. O idioma russo é complexo, mas se você não se importa com rima, pode "compor" um verso branco.

Com a música ainda é mais fácil. O programa determina quais acordes são mais característicos de um determinado artista e os utiliza, mas em uma sequência diferente. A base dessa "criatividade" é o embaralhamento da balança e a rejeição da cacofonia aberta.
Havia programas que compunham contos populares. Para isso, realizamos uma análise dos cenários usando o livro de Vladimir Propp “Morfologia de um conto”. Verificou-se que o modelo de desenvolvimento de eventos inclui vários elementos óbvios: os contos de fadas sempre têm personagens positivos e negativos. Há também um doador, uma estrada, um obstáculo e um final feliz no final. Uma característica distintiva de tais contos era o ecletismo. O programa combinou os heróis e suas ações, contando, por exemplo, sobre Ivan, o Louco, que está lutando com a Serpente Gorynych. Uma desvantagem absoluta foi a má linguagem da história. Os ouvintes ficaram entediados. Um contador de histórias vivo sempre adiciona humor e, em algum lugar, velocidade de fala divertida. Pelo mesmo motivo, o programa não pode traduzir metáforas ou unidades fraseológicas para outros idiomas. Tradutores online trabalham com grandes volumes de informação. Vale ressaltar que a qualidade de sua tradução melhorou significativamente nos últimos anos. Agora eles não traduzem cada palavra individualmente, como fizeram antes, mas procuram a frase inteira em algum lugar nos textos. A maior dificuldade surge com a semântica. Isso requer uma base de conhecimento para entender o significado das expressões. Por exemplo: galinhas estão prontas para o jantar. Não está claro como traduzir essa frase corretamente se você não sabe onde a pessoa está naquele momento - na granja (galinhas estão prontas para o jantar) ou em um restaurante (galinhas preparadas para o almoço).

Sem o conhecimento humano, nenhuma atividade intelectual é possível. O conhecimento não pode ser substituído por nada. A questão é como digitalizar essas habilidades. Como transformar a experiência em algum esquema significativo que possa ser compartilhado com a máquina.

Source: https://habr.com/ru/post/pt473564/


All Articles