
O Google trabalha no campo da
inteligência artificial há muito tempo. Tudo isso é necessário para a empresa, tanto para necessidades pessoais (melhorando o trabalho de vários serviços) quanto para oferecer novas oportunidades aos seus clientes. Agora, o Google anunciou uma nova função para sua IA, que foi ensinada a "ler" uma variedade de textos e a se formar com base nos resultados de um artigo lido no estilo da Wikipedia.
A IA pega materiais da Internet e os analisa, após o que cria algo como um currículo. Com base nos resultados de seu trabalho, os funcionários da corporação
escreveram um artigo indicando muitos pontos técnicos. A principal idéia deste artigo - a análise do que é lido é uma tarefa muito difícil para a máquina. Outras empresas tentaram realizar uma tarefa semelhante antes do Google, mas não tiveram sucesso - a maioria dos projetos semelhantes falhou.
Mas há quem conseguiu. Por exemplo, o Salesforce conseguiu treinar sua rede neural para coletar informações e analisá-las de acordo com um determinado algoritmo. Isso é algo semelhante ao que o Google fez, os resultados
também estão
disponíveis como um artigo. O resultado pode ser considerado satisfatório - a rede neural lidou com a tarefa geral, mas o texto gerado pelo computador não foi muito bom. As frases, na maioria das vezes, eram simples e curtas.
Também era difícil para um computador manter a estrutura semântica do conteúdo, com a qual uma pessoa lida sem nenhuma dificuldade. Quanto ao Google, esta empresa se saiu um pouco melhor. As ofertas que o computador oferece são mais longas que as do SalesForce e parecem mais naturais. Até agora, a máquina só pode funcionar com textos em inglês. Abaixo está um exemplo com duas notas diferentes. À esquerda está o escrito pelo homem. À direita, encontra-se o material “datilografado”, informações pelas quais a rede neural procurava em diferentes recursos.

O texto que o computador escreve é um pouco difícil de ler devido, por exemplo, à falta de letras maiúsculas no início de novas frases. Além disso, a maioria das propostas é um tanto pesada. No entanto, em geral, este texto é lido bem. Nesse caso em particular, a versão final não incluía todas as informações importantes da fonte; portanto, o exemplo em si não pode ser considerado muito indicativo. No entanto, é claro que a rede neural é realmente capaz de muito - no momento, essa é a melhor opção para o que o computador pode produzir após analisar o texto original.
O sistema procura informações sobre um determinado tópico em sites diferentes e gera uma lista das dez páginas mais relevantes que contêm os dados necessários. O resultado é um artigo completo com links - sobre o mesmo formato da Wikipedia. A propósito, o sistema criado pelo Google é de autoaprendizagem, de modo que todas as páginas lidas e criadas ajudam o computador a melhorar.
A propósito, o computador corta deliberadamente frases longas para torná-lo ainda mais parecido com o estilo adotado para os artigos na enciclopédia eletrônica Wikipedia. Assim, o computador não escreve tudo por si só - apenas forma sentenças próprias, reduzindo as iniciais, das quais algumas palavras podem ser descartadas, sem distorcer o significado do material lido.
O processo não pode ser chamado muito rápido, mas o resultado é bastante aceitável. De acordo com especialistas que formaram o algoritmo, em todo o projeto o "gargalo" é a alocação de fragmentos individuais de texto para formar um novo artigo. Todo esse trabalho não é feito muito rapidamente, portanto o algoritmo tem espaço para crescer e melhorar. Representantes da corporação disseram que agora o software e o hardware para esse trabalho não são muito perfeitos, então a empresa planeja melhorar ainda mais sua tecnologia.
A principal desvantagem do sistema atual é que o computador pega páginas com informações para escrever um artigo sobre um tópico com base em sua popularidade (visitas, tempo de leitura etc.). E se as informações postadas em uma das páginas não forem muito precisas, o resumo criado pelo computador também conterá erros e imprecisões. No entanto, a empresa espera que, em um futuro próximo, seja capaz de mostrar um processo ainda mais avançado de geração de textos.