Google bringt AI bei, Artikel im Wikipedia-Stil zu schreiben



Google ist seit langem auf dem Gebiet der künstlichen Intelligenz tätig . All dies ist für das Unternehmen sowohl für die persönlichen Bedürfnisse (Verbesserung der Arbeit verschiedener Dienstleistungen) als auch für die Bereitstellung neuer Möglichkeiten für seine Kunden erforderlich. Jetzt hat Google eine neue Funktion für seine KI angekündigt, mit der gelernt wurde, eine Vielzahl von Texten zu "lesen" und basierend auf den Ergebnissen eines gelesenen Artikels im Wikipedia-Stil zu formen.

AI nimmt Materialien aus dem Internet und analysiert sie. Danach erstellt es so etwas wie einen Lebenslauf. Basierend auf den Ergebnissen ihrer Arbeit haben die Mitarbeiter des Unternehmens einen Artikel geschrieben , in dem viele technische Punkte aufgeführt sind. Die Hauptidee dieses Artikels - die Analyse des Gelesenen - ist eine sehr schwierige Aufgabe für die Maschine. Andere Unternehmen haben versucht, eine ähnliche Aufgabe vor Google zu erledigen, aber sie waren nicht erfolgreich - die meisten ähnlichen Projekte sind fehlgeschlagen.

Aber es gibt diejenigen, die Erfolg hatten. Beispielsweise konnte Salesforce sein neuronales Netzwerk trainieren, um Informationen zu sammeln und nach einem bestimmten Algorithmus zu analysieren. Dies ist ähnlich wie bei Google. Die Ergebnisse sind auch als Artikel verfügbar . Das Ergebnis kann als zufriedenstellend bezeichnet werden - das neuronale Netzwerk hat die allgemeine Aufgabe bewältigt, aber der vom Computer generierte Text war nicht sehr gut. Die Sätze waren größtenteils einfach und kurz.

Für einen Computer war es auch schwierig, die semantische Struktur von Inhalten aufrechtzuerhalten, mit der eine Person problemlos fertig wird. Google hat sich etwas besser geschlagen. Die Angebote des Computers sind länger als die von SalesForce und sehen natürlicher aus. Bisher kann die Maschine nur mit englischen Texten arbeiten. Unten finden Sie ein Beispiel mit zwei verschiedenen Anmerkungen. Links ist die vom Menschen geschriebene. Auf der rechten Seite befindet sich „maschinengeschriebenes“ Material, Informationen, nach denen das neuronale Netzwerk auf verschiedenen Ressourcen gesucht hat.



Der Text, den der Computer schreibt, ist etwas schwer zu lesen, beispielsweise aufgrund des Fehlens von Großbuchstaben am Anfang neuer Sätze. Darüber hinaus sind die meisten Vorschläge etwas schwergewichtig. Im Allgemeinen wird dieser Text jedoch gut gelesen. In diesem speziellen Fall enthielt die endgültige Version nicht alle wichtigen Informationen aus der Quelle, sodass das Beispiel selbst nicht als sehr bezeichnend angesehen werden kann. Es ist jedoch klar, dass das neuronale Netzwerk wirklich viel kann - im Moment ist dies die beste Option für das, was der Computer nach der Analyse des Originaltextes produzieren kann.

Das System sucht auf verschiedenen Websites nach Informationen zu einem bestimmten Thema und generiert eine Liste der zehn wichtigsten Seiten, die die erforderlichen Daten enthalten. Das Ergebnis ist ein vollständiger Artikel mit Links - ungefähr im gleichen Format wie Wikipedia. Das von Google erstellte System ist übrigens selbstlernend, sodass jede gelesene und erstellte Seite dem Computer hilft, sich zu verbessern.

Übrigens schneidet der Computer absichtlich lange Sätze, um ihn noch mehr an den Stil der Artikel in der elektronischen Enzyklopädie Wikipedia anzupassen. Der Computer schreibt also nicht alles selbst - er bildet nur seine eigenen Sätze und reduziert die anfänglichen, aus denen einige Wörter verworfen werden können, ohne die Bedeutung des gelesenen Materials zu verzerren.

Der Prozess kann nicht zu schnell aufgerufen werden, aber das Ergebnis ist durchaus akzeptabel. Laut Experten, die den Algorithmus entwickelt haben, besteht der „Engpass“ in diesem gesamten Projekt in der Zuordnung einzelner Textfragmente zu einem neuen Artikel. All diese Arbeiten sind nicht zu schnell erledigt, sodass der Algorithmus Raum zum Wachsen und Verbessern bietet. Vertreter des Unternehmens sagten, dass jetzt die Software und Hardware für solche Arbeiten nicht zu perfekt sind, und das Unternehmen plant, seine Technologie weiter zu verbessern.

Der Hauptnachteil des aktuellen Systems besteht darin, dass der Computer Seiten mit Informationen zum Schreiben eines Artikels zu einem Thema auf der Grundlage seiner Beliebtheit (Besuche, Lesezeit usw.) erstellt. Und wenn die auf einer der Seiten veröffentlichten Informationen nicht sehr genau sind, enthält die vom Computer erstellte Zusammenfassung auch Fehler und Ungenauigkeiten. Dennoch hofft das Unternehmen, in naher Zukunft einen noch fortgeschritteneren Prozess der Texterstellung zeigen zu können.

Source: https://habr.com/ru/post/de410287/


All Articles