O programa escreve discursos políticos

Muitos perceberam que os discursos dos políticos têm um formato bastante padrão, são semelhantes entre si. É necessário repetir os pontos principais várias vezes usando formulações padrão. Parece que existe um algoritmo que define a estrutura de tais discursos.

A esse respeito, surge a pergunta: um computador pode gerar esses textos independentemente?

Valentin Kassarnig, da Universidade de Massachusetts, provou que isso é possível. Ele publicou um programa ( repositório github ) que faz exatamente isso: gera discursos políticos surpreendentemente semelhantes aos reais. O autor conta com mais detalhes sobre o gerador de textos políticos em um artigo científico .

No desenvolvimento do gerador, Valentine usou uma base de quase 4.000 fragmentos de debate político no Congresso dos EUA. O banco de dados inclui mais de 50.000 frases do texto, cada uma com uma média de 23 palavras. Kassarnig também classificou cada discurso por partido político (republicanos / democratas), bem como pelo princípio de atitude positiva / negativa em relação ao tópico da discussão.

No entanto, o mais importante é como analisar essa base. O autor tentou opções diferentes, mas acabou optando por N-gramas.

N-grama é uma sequência de n elementos. Nesse caso, é uma sequência de palavras e frases.

Primeiro, ele marcou nos textos todas as partes do discurso (substantivo, verbo, adjetivo etc.). Depois, usei o seguinte algoritmo: todos os 6 gramas são pesquisados ​​no banco de dados e a probabilidade da aparência de uma determinada palavra ou frase é calculada, dependendo de quais cinco estão à sua frente. "Isso nos permite identificar rapidamente todas as palavras que podem aparecer após as cinco palavras anteriores conhecidas e qual é a probabilidade de cada uma delas aparecer", diz Kassarnig.

O processo de geração de textos segue esse algoritmo. O programa indica a orientação política do discurso: deve ser o discurso de um candidato republicano ou democrático. O algoritmo usa uma base de 6 gramas para esta categoria para selecionar o conjunto completo de 5 gramas usados ​​para iniciar esses discursos. Então um desses 5 gramas é selecionado aleatoriamente, a palavra mais provável que termina 6 gramas é calculada. Bem, então ela começa a prever palavra por palavra até o final do texto.

Existem mais alguns truques, é claro. Por exemplo, um programa sabe a probabilidade de um tópico específico ser mencionado em um discurso - e quais tópicos estarão presentes ao lado dele.

Os resultados são surpreendentemente bons.

Texto de exemplo
Mr. Speaker, for years, honest but unfortunate consumers have had the ability to plead their case to come under bankruptcy protection and have their reasonable and valid debts discharged. The way the system is supposed to work, the bankruptcy court evaluates various factors including income, assets and debt to determine what debts can be paid and how consumers can get back on their feet. Stand up for growth and opportunity. Pass this legislation.

Kassarnig estudou os resultados e acredita que a alfabetização e a suavidade da transição da proposta para a oferta são muito boas.

Portanto, os políticos de língua inglesa puseram as mãos na ferramenta para fazer discursos rapidamente, se você precisar falar repentinamente diante de uma platéia, e eles não têm nada a dizer.

O programa também pode gerar outros textos. Por exemplo, postagens de blog e notas de notícias :).

Como o código-fonte é publicado em domínio público, quaisquer melhorias e bifurcações são incentivadas.

Source: https://habr.com/ru/post/pt389445/


All Articles