Os computadores escrevem prosa, mas ainda inferiores às pessoas. Porque



Dois anos atrás, em um concurso literário japonês, quase ganhei uma história escrita por inteligência artificial. É chamado "O dia em que o computador escreveu um romance". Mesmo que isso pareça uma personificação estúpida da piada "a melhor maneira de ganhar um milhão é escrever um livro, como ganhar um milhão", a história foi para o final, ignorando cerca de mil e quinhentos textos escritos por pessoas. Mas o avanço não aconteceu. Os textos de ficção ainda são escritos por pessoas, textos de não ficção - principalmente também.

Há alguns meses, Meanotek tentou criar um assistente de IA para escrever e escrever uma história com ele em colaboração. Spoiler - ele não teve sucesso. Os criadores do projeto nos disseram qual era a idéia e como foi implementada. E tentamos descobrir por que os poetas saem de carros melhor do que os escritores de prosa.

Eu entendo que você não entende, que nós não entendemos nada


No verão deste ano, a Fundação Sistema realizou um concurso de contos de ficção científica "The Future Time". Foi perguntado aos participantes o tópico - "Imortalidade", e ao vencedor foi prometido um jackpot sólido de meio milhão de rublos. Milhares de histórias foram enviadas aos organizadores, entre as quais uma foi escrita usando inteligência artificial.


A IA funciona melhor no gênero curto - poemas, citações sábias, motivadores e memes. Mas nem sempre tudo corre como o esperado. Por exemplo, o InspiroBot , criando pôsteres motivacionais, coloca palavras em coisas estranhas e às vezes assustadoras.

A história é chamada "O sapo abre suas asas" . Esta é uma história sobre a engenheira Fotino, dona de um conjunto cavalheiresco de qualidades características dos heróis do cyberpunk noir: dependência de drogas, passado sombrio, desvios mentais, tendências suicidas e reflexão sem fim sobre a natureza ilusória do mundo. Entre viagens alucinógenas, Fotino está tentando consertar a IA que administra a cidade.
Esta é uma história escrita não inteiramente pela AI, mas apenas com a participação dele. O experimento foi que um programa especial não foi usado para criar o texto, mas vários blocos de código foram reunidos, originalmente destinados a resolver outros problemas.

O sistema usou uma biblioteca de design próprio, que, por sua vez, usa Pytorch. Os diálogos eram compostos por um chatbot desenvolvido anteriormente, para títulos e descrições - uma rede recorrente muito grande, treinada em textos baixados do lib.ru.

  • Denis Tarasov ( Durham ), CEO da Meanotek.

Os aspectos mais importantes da escrita - a idéia e o enredo - ainda eram assumidos pelo homem. Segundo Denis, eles tentaram criar uma ferramenta que apenas ajudasse o escritor e não funcionasse para ele.
Os diálogos com AI são completamente gerados pelo sistema e deixados na forma em que foram recebidos. Diálogos entre caracteres são parcialmente gerados e a rugosidade é suavizada por aí. Reproduções repetidas removidas de frases como "Eu entendo que você não entende, que nós não entendemos nada". Embora uma certa proporção de tais expressões permanecesse. Todos os subtítulos também são gerados. Tentamos corrigir a ortografia e a gramática, mas é possível que mais erros tenham sido adicionados do que corrigidos.

  • Denis Tarasov ( Durham ), CEO da Meanotek.

No texto final, é difícil determinar a quantidade de máquina e texto humano. Segundo Denis, existem parágrafos em que uma frase foi composta por uma pessoa e a segunda - um algoritmo. “Uma série de episódios simplesmente não estaria na história sem títulos e“ sementes ”de inteligência artificial. Em geral, a estilística dos fragmentos de IA influenciou o estilo em que as pessoas escreviam. ”

O trabalho lembra, se é que se pode chamar assim, uma certa expansão da consciência. Depois de escrever uma frase ou parágrafo, uma pessoa se volta não apenas para sua imaginação, mas também parece que, com base em suas palavras, um computador foi gerado. "O homem tentou se adaptar ao que foi gerado e, se possível, reuniu tudo em uma trama significativa", diz Denis.



No entanto, o sucesso dos colegas japoneses falhou. A história nem chegou à longa lista. O membro do júri Nikolai V. Kononov escreveu sobre o “Sapo” assim:
A mão do editor é muito perceptível - e, em geral, a mão humana. Os desenvolvedores de bot, em colaboração com o algoritmo, escreveram uma história que provavelmente não causará rejeição entre os leitores de ficção. Nesse sentido, o experimento foi um sucesso.

“O que a maioria das pessoas gosta hoje não é necessariamente uma história de qualidade”, diz Denis. “A qualidade do texto ainda pode ser mais rígida, mas o principal problema é a falta de enredo. Acontece que as partes individuais do texto podem até conter significado, mas não têm começo nem fim, nem ideia comum. Só que algo está acontecendo, alguém está fazendo alguma coisa, conversando e não está terminando com nada. "

Mas você não consegue entender que vai resolver um problema que lhe permitirá criar algo


Quando a palavra "robô" foi criada, ela já era usada no contexto da pergunta filosófica "É justo considerar pessoas artificiais como pessoas". Esta é uma peça de Karel apek RUR Qualquer palavra também é um pensamento, um significado e o contexto por trás disso. De uma maneira boa, o escritor primeiro encontra idéias e significados e depois seleciona letras para eles.

Ainda assim, as próprias palavras nada mais são do que rabiscos de tinta ou pixel em um fundo branco.



O grande problema com os textos das máquinas é que o processo está indo ao contrário. O sistema seleciona um certo conjunto pequeno de palavras de um conjunto maior, e uma pessoa - lendo - tenta encontrar o significado nelas e itera sobre esses conjuntos até que o significado em sua opinião seja encontrado.
Até agora, os computadores aprenderam muito bem a escrever poesia. Isso pode ser visto no site botpoet.com , onde há um teste que mostra claramente que é difícil distinguir um poeta "humano" de um computador. Mas nos versículos muitas conexões lógicas são pensadas pelo leitor. Na prosa (especialmente na trama), geralmente é mais pronunciado, e o computador ainda está se saindo mal com isso. As redes neurais geralmente são treinadas em uma série de obras de um ou outro autor, mas elas só podem produzir textos externamente semelhantes, ou seja, imitam o estilo, mas não criam uma nova história.



Os funcionários da Yandex criaram uma rede neural, treinada em uma variedade de poesia russa, e depois alimentou os textos da Defesa Civil e emitiu poemas no estilo de Yegor Letov. Eles também gravaram o álbum "404" e chamaram o grupo "Neural Defense"

Como as parcelas são formalmente organizadas é um tópico de pesquisa de longa data. Antes do auge da TI, os pesquisadores classificavam manualmente milhares de textos em busca de padrões comuns. Um dos exemplos mais famosos é o livro de Joseph Campbell, Um Herói com Mil Faces. É uma tentativa de deduzir uma estrutura geral, uma sequência de situações, que é mais ou menos semelhante nos mitos da maioria dos povos. Vladimir Propp trabalhou em uma tarefa semelhante. No livro “A morfologia de um conto de fadas”, ele tentou descrever os componentes gerais das histórias folclóricas.

De acordo com esse conhecimento, as pessoas são ensinadas a fazer histórias. Os estudos sobre a forma de enredos caem em livros sobre escrita e roteiro, onde se transformam em instruções específicas. Por exemplo, o roteirista Blake Snyder no livro “Save the Cat” descreveu a estrutura clara de um bom filme em sua opinião, onde distribuiu as funções necessárias da trama até o local no tempo e no número de páginas.

Mas as instruções para as pessoas ainda não se transformaram em instruções para carros.
É mais difícil entender a estrutura da trama do texto e as reviravoltas da trama, porque, para começar, seria bom concordar com a forma como as apresentamos formalmente e depois já pensar em como extraí-las do texto. As instruções dos livros didáticos para escritores provavelmente podem ser colocadas no carro na forma de regras com algumas variáveis ​​preenchidas aleatoriamente (por exemplo, para selecionar a cidade de ação da lista de capitais europeias), mas isso dificilmente nos aproxima da criação de histórias originais. Penso que até agora é possível ensinar um computador a analisar se um novo texto em particular está mais próximo dos antigos bem-sucedidos ou malsucedidos e dar ao autor algumas recomendações, mas nada mais.


"Por enquanto, a IA não é capaz de avaliar a qualidade de uma história, porque, em princípio, os critérios de qualidade não são claros", diz Denis Tarasov. Mas se é muito rude comparar qualidade e sucesso, a IA pode fazer o trabalho.

No ano passado, saiu o best-seller Code, onde os roteiristas Jodi Archer e Matthew Jokers tentaram descrever as semelhanças entre os livros de sucesso. Eles alimentaram os textos dos livros a um sistema de computador construído sobre aprendizado de máquina (que, no entanto, não descreveu), comparou-os com sucesso comercial e padrões nomeados que poderiam contribuir para esse sucesso - temas, cenários, características de heróis e sequências na mudança de estado. .
Não é difícil derivar um tópico: para isso, existem algoritmos para extrair palavras-chave que criam um dicionário de frequência e ver quais palavras são encontradas com mais frequência do que a média no idioma. É verdade que, para aprender a converter palavras-chave em tópicos, ainda precisamos tentar: por exemplo, se sabemos que as palavras "beijo", "terno", "noite" e "lilás" são encontradas no texto com uma frequência anormalmente alta, um algoritmo que reduzirá essas palavras ao tema do "amor". Ou você pode pré-dividir os textos em classes por tópicos ("amor", "aventuras") e depois resolver o problema de classificar um novo texto - como é feito, por exemplo, em agregadores de notícias, nos quais é necessário entender se o texto se refere à economia, política etc. N. Em geral, esta tarefa parece bastante solucionável.

As características dos heróis também são analisadas bem. As humanidades digitais fazem muito disso, que muitas vezes se volta para a pesquisa em literatura digital. Por exemplo, o clássico desta área, Franco Moretti, construiu automaticamente e analisou a rede de conexões entre os personagens de Hamlet . Em material russo, por exemplo, o grupo de Frank Fischer na Higher School of Economics, que compôs o corpus do drama russo RusDraCor, lida com isso .



Criar um gerador dessas histórias não é um grande problema científico. Na Internet, existem geradores de histórias sobre esse princípio e até geradores de histórias em que você pode selecionar parâmetros e obter textos de qualidade diferente. Essa é toda a tarefa a ser resolvida, basta gastar tempo e esforço.

Primeiro, uma sequência de eventos de nível superior será gerada e, em seguida, cada evento ocorrerá até atingir o nível de frases e letras. Ou, em geral, você pode "reescrever" uma história popular, alterar os detalhes e agora a nova história popular está pronta.

  • Denis Tarasov ( Durham ), CEO da Meanotek.

Você precisa fazer o que você não sabe?


Outra questão é se isso faz sentido. Quando as pessoas tentam automatizar e robótica a produção pesada, o objetivo é claro - em muitos setores, as habilidades físicas das pessoas atingem o teto há muito tempo. Não existem problemas por escrito - esses problemas estão longe da gravidade física do trabalho de parto.

Pelo contrário, os leitores se queixam com mais frequência de qualquer tentativa de automatizar a escrita, trazendo-a a padrões e padrões comuns. Ao assistir, por exemplo, a um filme, é mais provável que as pessoas se decepcionem se a cada momento em um minuto bem definido ocorrer uma reviravolta na história. No cinema comercial caro, isso acontece cada vez mais frequentemente, mas não parece que chamaríamos de uma inovação incrível na arte dramática.


Na minha opinião, esse sistema na literatura causará grandes danos, pois propagará vários tipos de lixo literário, otimizando-o para as solicitações do leitor. Esse lixo é perfeitamente produzido sem um gerador, e com um gerador não haverá nada para respirar dele. Para escrever uma boa história, você precisa entender a complexidade das relações humanas, entender a biologia, a física e muito mais, em um bom nível - e não apenas poder adicionar cadeias de palavras que causam uma determinada resposta emocional do leitor.

Esse problema não é resolvido por nenhum algoritmo simples. Precisamos de um nível de inteligência e conhecimento de uma pessoa e de uma pessoa extraordinária. A IA deve ser capaz de construir os próprios modelos do mundo e a capacidade de prever os resultados de vários eventos, e esse é um problema que não está resolvido agora, e a ciência está apenas começando a se aproximar dele.

Portanto, nossa direção no experimento é uma tentativa de combinar IA e homem.

  • Denis Tarasov ( Durham ), CEO da Meanotek.

Por um lado, a automação pode realmente arruinar a literatura. Por outro lado, se a IA se tornar apenas um expansor da imaginação, se fornecer algo que o próprio autor nunca teria inventado, um computador poderá realmente se tornar uma saída para crises criativas, pessoais e globais.

Source: https://habr.com/ru/post/pt430116/


All Articles