Tableau Software présente une interface de visualisation en langage naturel

Bonjour, Habr! Je vous présente la traduction de l' article «Tableau parle d'interface en langage naturel pour créer des visualisations» de Peter Sayer .

Le fournisseur de BI cherche à simplifier et à automatiser l'analyse des données dans le cadre d'une tendance croissante à intégrer des capacités d'IA (intelligence artificielle) dans les outils de BI.

image

Combien de statisticiens sont nécessaires pour construire un nouveau modèle de données? Selon Tableau Software, pas du tout. La société affirme que la prochaine version de l'outil analytique largement utilisé le fera elle-même.

Tableau l'a démontré la semaine dernière dans une nouvelle fonctionnalité appelée Ask Data qui permet aux utilisateurs de créer des visualisations en décrivant ce qu'ils veulent en langage naturel. Cela a été fait lors d'un événement client à la Nouvelle-Orléans. De plus, la société a démontré de nouvelles fonctionnalités d'automatisation dans son outil de préparation de données.

Cela fait partie d'une tendance croissante parmi les développeurs de logiciels d'entreprise à automatiser et à simplifier les tâches qui nécessitaient auparavant des compétences spécialisées, permettant aux entreprises d'utiliser plus efficacement leurs données et de déplacer du personnel qualifié vers des travaux moins exigeants en main-d'œuvre.

L'aube de la technologie de l'IA en BI


Les réalisations dans le domaine de l'intelligence artificielle permettent aux développeurs de logiciels d'entreprise de saisir plus facilement les données dans un langage naturel - verbal ou imprimé - et d'afficher les informations dont l'utilisateur a besoin, au lieu de le forcer à apprendre des commandes spécifiques ou à utiliser des objets à l'écran pour atteindre leurs objectifs. L'IA est de plus en plus utilisée dans les principaux outils de BI dans l'espoir de «démocratiser» l'analyse et la science des données.

Microsoft Power BI, un concurrent de Tableau, a introduit une fonctionnalité appelée «Questions et réponses» il y a quelques années, mais même dans les démos récentes, la phrase semble plus compliquée en grammaire et en orthographe que Tableau Ask Data. Cependant, ils sont tous deux en avance sur Dundas BI et similaires, qui utilisent toujours le glisser-déposer pour créer des visualisations.

L'implémentation de Tableau permettra aux utilisateurs d'interroger la base de données et donnera au logiciel la possibilité de déterminer indépendamment comment les tables de base de données doivent être combinées, quelles colonnes doivent être sélectionnées et quelles opérations doivent être effectuées pour obtenir la réponse souhaitée. Cela et d'autres nouvelles fonctionnalités apparaîtront dans Tableau 2019.1, qui devrait être publié au début de l'année prochaine, et une version bêta sera publiée fin octobre.

" De telles fonctionnalités d'automatisation sont les bienvenues et nécessaires ", a déclaré Martha Bennett, analyste en chef de Forrester. « Nous obtenons de plus en plus de données, mais les gens qui travaillent avec eux n'ont pas beaucoup de temps

Selon elle, les spécialistes des données passent jusqu'à 80% de leur temps à préparer des données, et moins ils y consacrent de temps, plus ils seront en mesure de réaliser les fonctions de BI qui profitent directement à l'entreprise.

Une façon de surmonter le manque de temps chez les spécialistes est de transférer la majeure partie de la charge de travail aux machines. Une autre façon consiste à simplifier le travail avec les données pour les personnes qui auparavant ne pouvaient pas travailler avec elles-mêmes en raison de la nécessité d'avoir des compétences particulières. Il s'agit de la soi-disant «démocratisation» des données.

Inconvénients de l'utilisation de l'IA


" Mais il y a des risques à fournir des données à un plus grand nombre d'employés: les données ne peuvent pas remplacer les connaissances d'experts dans le domaine et une évaluation sobre des situations ", a déclaré Martha Bennett.

« Avant de rendre les nouvelles fonctionnalités d'automatisation largement disponibles, les DSI devraient les tester avec leur propre expérience pour déterminer si elles sont appropriées », conseille-t-elle.

Les outils qui offrent une analyse des données sans recommandations claires peuvent confondre les utilisateurs avec les actions à entreprendre.

" Si vous ne donnez pas d'instructions détaillées à quelqu'un, alors vous ne devriez pas vous attendre à ce qu'il fasse tout correctement la première fois ."
- Marta Bennett, analyste en chef Forrester

Cependant, vous ne pouvez pas simplement blâmer le logiciel.

«L' automatisation n'est pas la même chose que le contrôle. Toutes ces choses doivent encore être suivies. Cela ne sonnera pas très bien en cour si vous dites que l'ordinateur lui-même a fait cela, et nous n'avons aucune idée pourquoi » , prévient Martha Bennett. Ce problème est connu depuis longtemps sous le nom de problème de boîte noire de l'IA.

De plus, vous devez savoir si vos données conviennent à un outil d'automatisation: en particulier, les systèmes d'apprentissage automatique nécessitent beaucoup de données pour fonctionner.

" Si vous appliquez des algorithmes d'apprentissage automatique aux données pour lesquelles vous avez plus d'exceptions que la normale, cela ne fonctionnera pas ", a-t-elle déclaré.

Détails de la démo


Lors d'un événement à la Nouvelle-Orléans, le directeur de l'analyse visuelle Andrew Vigno a démontré les capacités d'Ask Data dans la base de données du projet de crowdfunding Kickstarter, montrant que, contrairement à la plupart des compilateurs, Ask Data n'a pas besoin d'une ponctuation parfaite pour fonctionner.

Le logiciel a transformé sa requête «quel était le financement total» (littéralement) en «montant du financement» et a renvoyé une réponse. Lorsqu'il a imprimé «par années» et «par statut», Ask Data a converti sa demande en «montant du financement par terme et par statut». Puis, n'ayant pas de données supplémentaires, elle a préparé un graphique en courbes de couleurs montrant que le financement vert pour les projets réussis augmente chaque année, tandis que le financement pour les projets échoués, annulés ou suspendus (rouge, orange et jaune) reste inchangé.

La question «quelles catégories ont réussi» a provoqué une réponse visuelle différente: Ask Data a ajouté «par catégorie, statut du filtre - réussi» à la requête précédente et a tracé un histogramme du classement des catégories Kickstarter par le nombre de projets réussis dans l'ordre décroissant.

Les employés souhaitaient depuis longtemps que les logiciels d'entreprise fassent ce qu'ils voulaient, même s'ils n'étaient pas en mesure d'articuler la tâche, et Andrew Vigno a montré que Tableau s'approchait de cela. Lorsqu'il a tapé «comparer avec le financement moyen» (littéralement), Ask Data lui a montré la répartition du nombre de projets à côté du financement moyen pour les différentes sous-catégories de projets technologiques qu'il avait précédemment examinés.

Certaines choses dans Tableau sont encore plus rapides à faire avec la souris, surtout si vous tapez lentement: l'ajout d'une sous-catégorie «mod» et «jeu» au diagramme de dispersion ne prend que quatre clics.

Création de nouveaux modèles de données


Quelques clics suffisent à son collègue Tyler Doyle pour créer un nouveau modèle de données qui affiche les champs utilisés par Tableau pour analyser les données dans les requêtes SQL et que la base de données sous-jacente peut comprendre.

« Il me suffit de cliquer sur une ligne -« Ajouter des objets associés », et votre modèle de données est prêt, sans qu'il soit nécessaire de déterminer les tables à utiliser, comment elles sont connectées ou de quoi il s'agit, à gauche ou à droite. Les nouvelles capacités de modélisation des données de Tableau le font juste pour vous. "
- Tyler Doyle

« Comment le modèle de données a-t-il connu les relations correctes entre ces tables? »- se demande Doyle. Il s'avère que Tableau s'appuie sur les DSI ainsi que sur leurs administrateurs de base de données et professionnels des données. Pour l'aider à effectuer cette opération, vous devez vous assurer que les informations nécessaires sont stockées dans l'entrepôt de données.

La préparation des données est un autre domaine sur lequel Tableau travaille. L'ingénieur principal Zahira Valani a montré comment Tableau Prep peut automatiser le nettoyage des données à l'aide de rôles. Tableau les utilise pour identifier les champs qui jouent un rôle, comme des URL, des adresses e-mail ou des indications géographiques (États ou codes postaux). Valani a montré comment, en seulement quelques clics, Tableau Prep peut vérifier le contenu d'un champ pour déterminer le rôle le plus approprié, puis sélectionner des éléments non valides qui ne correspondent pas au rôle et les définir sur «null» ou filtrer ces lignes. Vous pouvez faire de même avec les rôles personnalisés, tels que les types énumérés.

Selon le chef de produit de Tableau, François Ejenstat, Tableau Prep sera mis à jour mensuellement, par opposition à un calendrier de trois versions par an pour le principal logiciel Tableau.

La planification est une fonctionnalité d'un autre outil actuellement en test bêta dans l'entreprise: Tableau Prep Conductor. Il permettra aux entreprises d'automatiser la préparation de leurs sources de données en les déplaçant vers Tableau selon le calendrier choisi. Il s'agit d'un produit distinct de Tableau et nécessitera une licence distincte pour l'utiliser. Le début des ventes est prévu pour l'année prochaine.

Source: https://habr.com/ru/post/fr431724/


All Articles