Google le enseña a AI a escribir artículos al estilo de Wikipedia



Google ha estado trabajando en el campo de la inteligencia artificial durante mucho tiempo. Todo esto es necesario para la empresa tanto para las necesidades personales (mejorar el trabajo de varios servicios) como para brindar nuevas oportunidades a sus clientes. Ahora Google ha anunciado una nueva función para su IA, que se le enseñó a "leer" una variedad de textos y a formarse en función de los resultados de un artículo leído en estilo Wikipedia.

AI toma materiales de Internet y los analiza, luego de lo cual crea algo así como un currículum. Basado en los resultados de su trabajo, los empleados de la corporación escribieron un artículo indicando muchos puntos técnicos. La idea principal de este artículo: el análisis de lo que se lee es una tarea muy difícil para la máquina. Otras compañías intentaron realizar una tarea similar antes de Google, pero no tuvieron éxito, la mayoría de los proyectos similares fallaron.

Pero hay quienes tuvieron éxito. Por ejemplo, Salesforce pudo entrenar su red neuronal para recopilar información y analizarla de acuerdo con un algoritmo dado. Esto es algo similar a lo que hizo Google, los resultados también están disponibles como un artículo. El resultado puede llamarse satisfactorio: la red neuronal hizo frente a la tarea general, pero el texto generado por la computadora no era muy bueno. Las oraciones, en su mayor parte, eran simples y cortas.

También era difícil para una computadora mantener la estructura semántica del contenido, que una persona enfrenta sin ninguna dificultad. En cuanto a Google, a esta compañía le fue un poco mejor. Las ofertas que ofrece la computadora son más largas que las de SalesForce y se ven más naturales. Hasta ahora, la máquina solo puede trabajar con textos en inglés. A continuación se muestra un ejemplo con dos notas diferentes. A la izquierda está el escrito por el hombre. A la derecha hay material "mecanografiado", información que la red neuronal estaba buscando en diferentes recursos.



El texto que escribe la computadora es algo difícil de leer debido, por ejemplo, a la falta de letras mayúsculas al comienzo de las nuevas oraciones. Además, la mayoría de las propuestas son algo pesadas. Sin embargo, en general, este texto se lee bien. En este caso particular, la versión final no incluía toda la información importante de la fuente, por lo que el ejemplo en sí no puede considerarse muy indicativo. Sin embargo, está claro que la red neuronal es realmente capaz de mucho; en este momento, esta es la mejor opción para lo que la computadora puede producir después de analizar el texto original.

El sistema busca información sobre un tema determinado en diferentes sitios y genera una lista de las diez páginas más relevantes que contienen los datos necesarios. El resultado es un artículo completo con enlaces, sobre el mismo formato que Wikipedia. Por cierto, el sistema creado por Google es de autoaprendizaje, por lo que cada página leída y creada ayuda a la computadora a mejorar.

Por cierto, la computadora corta deliberadamente largas oraciones para que se parezca aún más al estilo adoptado para los artículos de la enciclopedia electrónica Wikipedia. Por lo tanto, la computadora no escribe todo por sí misma: solo forma sus propias oraciones, reduciendo las iniciales, de las que se pueden descartar algunas palabras, sin distorsionar el significado del material leído.

El proceso no se puede llamar demasiado rápido, pero el resultado es bastante aceptable. Según los expertos que formaron el algoritmo, en todo este proyecto, el "cuello de botella" es la asignación de fragmentos individuales de texto para formar un nuevo artículo. Todo este trabajo no se realiza demasiado rápido, por lo que el algoritmo tiene espacio para crecer y mejorar. Los representantes de la corporación dijeron que ahora el software y el hardware para dicho trabajo no son demasiado perfectos, por lo que la compañía planea mejorar aún más su tecnología.

El principal inconveniente del sistema actual es que la computadora toma páginas con información para escribir un artículo sobre un tema en función de su popularidad (visitas, tiempo de lectura, etc.). Y si la información publicada en una de las páginas no es muy precisa, entonces el resumen que crea la computadora también contendrá errores e inexactitudes. Sin embargo, la compañía espera que en un futuro cercano pueda mostrar un proceso aún más avanzado de generación de textos.

Source: https://habr.com/ru/post/es410287/


All Articles