Tableau Software führt die Visualisierungsoberfläche für natürliche Sprachen ein

Hallo Habr! Ich präsentiere Ihnen die Übersetzung des Artikels „Tableau spricht über eine Oberfläche in natürlicher Sprache zum Erstellen von Visualisierungen“ von Peter Sayer .

Der BI-Anbieter versucht, die Datenanalyse im Rahmen eines wachsenden Trends zur Integration von KI-Funktionen (künstliche Intelligenz) in BI-Tools zu vereinfachen und zu automatisieren.

Bild

Wie viele Statistiker werden benötigt, um ein neues Datenmodell zu erstellen? Laut Tableau Software überhaupt nicht. Das Unternehmen behauptet, dass die nächste Version des weit verbreiteten Analysetools dies selbst tun wird.

Tableau hat dies letzte Woche in einer neuen Funktion namens Ask Data demonstriert, mit der Benutzer Visualisierungen erstellen können, indem sie beschreiben, was sie in natürlicher Sprache wollen. Dies wurde bei einer Kundenveranstaltung in New Orleans durchgeführt. Darüber hinaus hat das Unternehmen in seinem Datenaufbereitungstool neue Automatisierungsfunktionen demonstriert.

Dies ist Teil eines wachsenden Trends unter Entwicklern von Unternehmenssoftware, Aufgaben zu automatisieren und zu vereinfachen, für die früher spezielle Fähigkeiten erforderlich waren, damit Unternehmen ihre Daten effizienter nutzen und qualifiziertes Personal für weniger arbeitsintensive Arbeiten einsetzen können.

Beginn der KI-Technologie in BI


Erfolge auf dem Gebiet der künstlichen Intelligenz erleichtern Entwicklern von Unternehmenssoftware die Eingabe von Daten in einer natürlichen Sprache - verbal oder gedruckt - und die Anzeige der vom Benutzer benötigten Informationen, anstatt ihn zu zwingen, bestimmte Befehle zu lernen oder Objekte auf dem Bildschirm zu bedienen, um ihre Ziele zu erreichen. KI wird zunehmend in führenden BI-Tools eingesetzt, um Analytik und Datenwissenschaft zu "demokratisieren".

Microsoft Power BI, ein Konkurrent von Tableau, hat vor einigen Jahren eine Funktion namens "Fragen und Antworten" eingeführt. Selbst in den jüngsten Demos scheint der Satz in Grammatik und Rechtschreibung komplizierter zu sein als Tableau Ask Data. Beide sind jedoch Dundas BI und dergleichen voraus, die weiterhin Drag & Drop zum Erstellen von Visualisierungen verwenden.

Durch die Implementierung von Tableau können Benutzer die Datenbank abfragen und der Software die Möglichkeit geben, unabhängig zu bestimmen, wie die Datenbanktabellen kombiniert werden sollen, welche Spalten ausgewählt werden sollen und welche Vorgänge ausgeführt werden müssen, um die gewünschte Antwort zu erhalten. Diese und weitere neue Funktionen werden in Tableau 2019.1 veröffentlicht, das voraussichtlich Anfang nächsten Jahres veröffentlicht wird. Eine Beta-Version wird Ende Oktober veröffentlicht.

" Solche Automatisierungsfunktionen sind willkommen und notwendig ", sagte Forrester-Chefanalystin Martha Bennett. " Wir bekommen immer mehr Daten, aber die Leute, die mit ihnen arbeiten, haben nicht so viel Zeit ."

Laut ihr verbringen Datenspezialisten bis zu 80 Prozent ihrer Zeit mit der Vorbereitung von Daten. Je weniger Zeit sie damit verbringen, desto mehr können sie die BI-Funktionen ausführen, von denen das Unternehmen direkt profitiert.

Eine Möglichkeit, den Zeitmangel unter Spezialisten zu überwinden, besteht darin, den größten Teil der Arbeitslast auf Maschinen zu übertragen. Eine andere Möglichkeit besteht darin, die Arbeit mit Daten für Personen zu vereinfachen, die zuvor aufgrund spezieller Fähigkeiten nicht selbst mit ihnen arbeiten konnten. Dies ist die sogenannte "Demokratisierung" von Daten.

Nachteile der Verwendung von AI


"Die Bereitstellung von Daten für eine größere Anzahl von Mitarbeitern birgt jedoch Risiken: Daten können Expertenwissen auf dem Fachgebiet und eine nüchterne Einschätzung von Situationen nicht ersetzen ", sagte Martha Bennett.

Bevor CIOs neue Automatisierungsfunktionen allgemein verfügbar machen, sollten sie diese mit ihrer eigenen Erfahrung testen, um festzustellen, ob sie angemessen sind“, rät sie.

Tools, die Datenanalysen ohne klare Empfehlungen anbieten, können Benutzer mit den zu treffenden Maßnahmen verwirren.

" Wenn Sie jemandem keine detaillierten Anweisungen geben, sollten Sie nicht erwarten, dass er beim ersten Mal alles richtig macht ."
- Marta Bennett, Forrester Chief Analyst

Sie können jedoch nicht nur die Software beschuldigen.

Automatisierung ist nicht dasselbe wie Kontrolle. All diese Dinge müssen noch befolgt werden. Vor Gericht wird es nicht sehr gut klingen, wenn Sie sagen, dass der Computer dies selbst getan hat, und wir haben keine Ahnung, warum “, warnt Martha Bennett. Dieses Problem ist seit langem als AI-Black-Box-Problem bekannt.

Darüber hinaus müssen Sie herausfinden, ob Ihre Daten für ein Automatisierungstool geeignet sind: Insbesondere für maschinelle Lernsysteme sind viele Daten erforderlich.

" Wenn Sie Algorithmen für maschinelles Lernen auf Daten anwenden, bei denen Sie mehr Ausnahmen als normal haben, funktioniert dies nicht ", sagte sie.

Demo Details


Auf einer Veranstaltung in New Orleans demonstrierte Andrew Vigno, Manager für visuelle Analysen, die Funktionen von Ask Data in der Crowdfunding-Datenbank von Kickstarter und zeigte, dass Ask Data im Gegensatz zu den meisten Compilern keine perfekte Interpunktion erfordert, um zu funktionieren.

Die Software wandelte seine Anfrage "Was war die Gesamtfinanzierung?" (Wörtlich) in "Höhe der Finanzierung" um und gab eine Antwort zurück. Als er "nach Jahren" und "nach Status" druckte, wandelte Ask Data seine Anfrage in "den Finanzierungsbetrag nach Laufzeit und Status" um. Da sie keine zusätzlichen Daten hatte, erstellte sie ein farbiges Liniendiagramm, in dem die Finanzierung für erfolgreiche Projekte in Grün dargestellt ist, die jedes Jahr zunimmt, während die Finanzierung für fehlgeschlagene, abgebrochene oder suspendierte Projekte (rot, orange und gelb) unverändert bleibt.

Die Frage „Welche Kategorien waren erfolgreich?“ Verursachte eine andere visuelle Antwort: Ask Data fügte der vorherigen Abfrage „nach Kategorie, Filterstatus - erfolgreich“ hinzu und zeichnete ein Histogramm der Rangfolge der Kickstarter-Kategorien nach der Anzahl der erfolgreichen Projekte in absteigender Reihenfolge.

Die Mitarbeiter wollten lange, dass Unternehmenssoftware das tut, was sie wollten, auch wenn sie die Aufgabe nicht artikulieren konnten, und Andrew Vigno zeigte, dass Tableau sich dem nähert. Als er "im Vergleich zur durchschnittlichen Finanzierung" (wörtlich) tippte, zeigte ihm Ask Data die Verteilung der Anzahl der Projekte neben der durchschnittlichen Finanzierung für die verschiedenen Unterkategorien von Technologieprojekten, die er zuvor überprüft hatte.

Einige Dinge in Tableau sind mit der Maus immer noch schneller zu erledigen, insbesondere wenn Sie langsam tippen: Das Hinzufügen einer Unterkategorie von "Mod" und "Spiel" zum Streudiagramm dauert nur vier Klicks.

Neue Datenmodelle erstellen


Mit wenigen Klicks musste sein Kollege Tyler Doyle ein neues Datenmodell erstellen, das die Felder anzeigt, die Tableau zum Analysieren von Daten in SQL-Abfragen verwendet und die die zugrunde liegende Datenbank verstehen kann.

Es reicht mir, auf eine Zeile zu klicken -„ Verwandte Objekte hinzufügen “- und Ihr Datenmodell ist fertig, ohne dass Sie bestimmen müssen, welche Tabellen verwendet werden sollen, wie sie verbunden sind oder was es ist, links oder rechts verknüpfen. Die neuen Datenmodellierungsfunktionen in Tableau erledigen dies nur für Sie. ""
- Tyler Doyle

Woher kannte das Datenmodell die richtigen Beziehungen zwischen diesen Tabellen? ”- wundert sich Doyle. Es stellt sich heraus, dass Tableau sowohl auf CIOs als auch auf deren Datenbankadministratoren und Datenexperten angewiesen ist. Um ihn bei diesem Trick zu unterstützen, müssen Sie sicherstellen, dass die erforderlichen Informationen im Data Warehouse gespeichert sind.

Die Datenaufbereitung ist ein weiterer Bereich, an dem Tableau arbeitet. Senior Engineer Zahira Valani zeigte, wie Tableau Prep die Datenbereinigung mithilfe von Rollen automatisieren kann. Tableau verwendet sie, um Felder zu identifizieren, die eine Rolle spielen - beispielsweise URLs, E-Mail-Adressen oder geografische Angaben (Bundesstaaten oder Postleitzahlen). Valani zeigte, wie Tableau Prep mit nur wenigen Klicks den Inhalt eines Felds überprüfen kann, um die am besten geeignete Rolle zu ermitteln, und dann ungültige Elemente auswählt, die nicht mit der Rolle übereinstimmen, und sie entweder auf "null" setzt oder diese Zeilen filtert. Sie können dasselbe mit benutzerdefinierten Rollen tun, z. B. mit Aufzählungstypen.

Laut François Eienstat, Chief Product Officer von Tableau, wird Tableau Prep monatlich aktualisiert, im Gegensatz zum Zeitplan von drei Releases pro Jahr für die Haupttableau-Software.

Die Planung ist eine Funktion eines anderen Tools, das derzeit im Beta-Test des Unternehmens getestet wird: Tableau Prep Conductor. Unternehmen können damit die Vorbereitung ihrer Datenquellen automatisieren, indem sie sie gemäß dem von ihnen gewählten Zeitplan auf Tableau verschieben. Dies ist ein separates Produkt von Tableau und erfordert eine separate Lizenz, um es zu verwenden. Der Verkaufsstart ist für nächstes Jahr geplant.

Source: https://habr.com/ru/post/de431724/


All Articles