El programa escribe discursos políticos.

Muchos notaron que los discursos de los políticos tienen un formato bastante estándar, son similares entre sí. Es necesario repetir los puntos principales varias veces usando formulaciones estándar. Parece que hay un algoritmo que define la estructura de tales discursos.

A este respecto, surge la pregunta: ¿puede una computadora generar tales textos de forma independiente?

Valentin Kassarnig, de la Universidad de Massachusetts, ha demostrado que esto es posible. Publicó un programa ( repositorio github ) que hace exactamente eso: genera discursos políticos que son sorprendentemente similares a los reales. El autor cuenta con más detalle sobre el generador de textos políticos en un artículo científico .

Al desarrollar el generador, Valentine utilizó una base de casi 4.000 fragmentos de debate político en el Congreso de los Estados Unidos. La base de datos incluye más de 50,000 oraciones del texto, cada una de las cuales tiene un promedio de 23 palabras. Kassarnig también clasificó cada discurso por partido político (republicanos / demócratas), así como por el principio de actitud positiva / negativa hacia el tema de discusión.

Sin embargo, lo más importante es cómo analizar esta base. El autor probó diferentes opciones, pero finalmente se decidió por N-gramos.

N-gram es una secuencia de n elementos. En este caso, es una secuencia de palabras y frases.

Primero, marcó en los textos todas las partes del discurso (sustantivo, verbo, adjetivo, etc.). Luego utilicé el siguiente algoritmo: se buscan todos los 6 gramos en la base de datos y se calcula la probabilidad de la aparición de una determinada palabra o frase, dependiendo de qué cinco están delante de ella. "Esto nos permite identificar rápidamente todas las palabras que pueden aparecer después de las cinco palabras anteriores conocidas, y cuál es la probabilidad de que cada una de ellas aparezca", dice Kassarnig.

El proceso de generación de textos se sigue de este algoritmo. El programa indica la orientación política del discurso: debe ser el discurso de un candidato republicano o democrático. El algoritmo utiliza una base de 6 gramos para esta categoría para seleccionar el conjunto completo de 5 gramos que se utilizan para iniciar dichos discursos. Luego, uno de estos 5 gramos se selecciona al azar, se calcula la palabra más probable que termina en 6 gramos. Bueno, entonces ella comienza a predecir palabra por palabra hasta el final del texto.

Hay un par de trucos más, por supuesto. Por ejemplo, un programa sabe la probabilidad de que se mencione un tema en particular en un discurso, y qué temas estarán presentes al lado.

Los resultados son sorprendentemente buenos.

Texto de muestra
Mr. Speaker, for years, honest but unfortunate consumers have had the ability to plead their case to come under bankruptcy protection and have their reasonable and valid debts discharged. The way the system is supposed to work, the bankruptcy court evaluates various factors including income, assets and debt to determine what debts can be paid and how consumers can get back on their feet. Stand up for growth and opportunity. Pass this legislation.

Kassarnig estudió los resultados y cree que la alfabetización y la fluidez de la transición de la propuesta a la oferta es muy buena.

Entonces, los políticos de habla inglesa pusieron sus manos en la herramienta para hacer discursos rápidamente, si de repente necesitas hablar ante una audiencia, y no tienen nada que decir.

El programa también puede generar otros textos. Por ejemplo, publicaciones de blog y notas de noticias :).

Dado que el código fuente se publica en el dominio público, se recomienda cualquier mejora y bifurcación.

Source: https://habr.com/ru/post/es389445/


All Articles