Hola Habr! Les presento la traducción del artículo "Tableau habla de la interfaz de lenguaje natural para crear visualizaciones" de Peter Sayer .
El proveedor de BI busca simplificar y automatizar el análisis de datos como parte de una tendencia creciente de incorporar capacidades de inteligencia artificial (IA) en las herramientas de BI.
¿Cuántos estadísticos se necesitan para construir un nuevo modelo de datos? Según Tableau Software, en absoluto. La compañía afirma que la próxima versión de la herramienta analítica ampliamente utilizada lo hará por sí misma.
Tableau demostró esto la semana pasada en una nueva función llamada Ask Data que permite a los usuarios crear visualizaciones describiendo lo que quieren en lenguaje natural. Esto se hizo en un evento para clientes en Nueva Orleans. Además, la compañía ha demostrado nuevas funciones de automatización en su herramienta de preparación de datos.
Esto es parte de una tendencia creciente entre los desarrolladores de software empresarial para automatizar y simplificar tareas que alguna vez requirieron habilidades especializadas, lo que permite a las empresas usar sus datos de manera más eficiente y reubicar al personal calificado para un trabajo que requiere menos mano de obra.
Amanecer de la tecnología de IA en BI
Los logros en el campo de la inteligencia artificial facilitan que los desarrolladores de software corporativo ingresen datos en un lenguaje natural, verbal o impreso, y muestren la información que el usuario necesita, en lugar de obligarlo a aprender comandos específicos u operar objetos en la pantalla para lograr sus objetivos. La IA se utiliza cada vez más en las principales herramientas de BI con la esperanza de "democratizar" la analítica y la ciencia de datos.
Microsoft Power BI, un competidor de Tableau, introdujo una característica llamada "Preguntas y respuestas" hace unos años, pero incluso en demostraciones recientes, la oración parece más complicada en gramática y ortografía que Tableau Ask Data. Sin embargo, ambos están por delante de Dundas BI y similares, que todavía usan arrastrar y soltar para crear visualizaciones.
La implementación de Tableau permitirá a los usuarios consultar la base de datos y brindará la oportunidad para que el software determine independientemente cómo se deben combinar las tablas de la base de datos, qué columnas se deben seleccionar y qué operaciones se deben realizar para obtener la respuesta deseada. Esta y otras características nuevas aparecerán en Tableau 2019.1, que se lanzará a principios del próximo año, y se lanzará una versión beta a fines de octubre.
"
Tales características de automatización son bienvenidas y necesarias ", dijo la analista jefe de Forrester, Martha Bennett. "
Estamos obteniendo cada vez más datos, pero las personas que trabajan con ellos no tienen tanto tiempo ".
Según ella, los especialistas en datos pasan hasta el 80 por ciento de su tiempo preparando datos, y cuanto menos tiempo pasen en ellos, más podrán hacer esas funciones de BI que benefician directamente al negocio.
Una forma de superar la falta de tiempo entre los especialistas es transferir la mayor parte de la carga de trabajo a las máquinas. Otra forma es simplificar el trabajo con datos para personas que anteriormente no podían trabajar con ellos por la necesidad de tener habilidades especiales. Esta es la llamada "democratización" de los datos.
Desventajas de usar AI
"
Pero existen riesgos al proporcionar datos a un mayor número de empleados: los datos no pueden reemplazar el conocimiento experto en el área temática y la evaluación sobria de las situaciones ", dijo Martha Bennett.
"
Antes de hacer que las nuevas funciones de automatización estén ampliamente disponibles, los CIO deben probarlas con su propia experiencia para determinar si son apropiadas ", aconseja.
Las herramientas que ofrecen análisis de datos sin recomendaciones claras pueden confundir a los usuarios con las acciones que deben tomar.
" Si no le das instrucciones detalladas a alguien, entonces no debes esperar que haga todo bien la primera vez ".
- Marta Bennett, analista jefe de Forrester
Sin embargo, no puedes culpar al software.
“La
automatización no es lo mismo que el control. Todas estas cosas aún deben seguirse. No sonará muy bien en la corte si dice que la computadora misma hizo esto, y no tenemos idea de por qué ”
, advierte Martha Bennett. Este problema se conoce desde hace mucho tiempo como el problema de la caja negra de AI.
Además, debe averiguar si sus datos son adecuados para una herramienta de automatización: en particular, los sistemas de aprendizaje automático requieren una gran cantidad de datos para funcionar.
"
Si aplica algoritmos de aprendizaje automático a los datos donde tiene más excepciones de lo normal, no funcionará ", dijo.
Detalles de la demostración
En un evento de Nueva Orleans, el gerente de análisis visual Andrew Vigno demostró las capacidades de Ask Data en la base de datos del proyecto de crowdfunding Kickstarter, demostrando que, a diferencia de la mayoría de los compiladores, Ask Data no requiere una puntuación perfecta para funcionar.
El software convirtió su consulta "cuál era la financiación total" (literalmente) en "la cantidad de financiación" y devolvió una respuesta. Cuando imprimió "por años" y "por estado", Ask Data convirtió su solicitud en "la cantidad de financiamiento por plazo y por estado". Luego, al no tener datos adicionales, preparó una tabla de líneas de color que mostraba fondos verdes para proyectos exitosos que aumentaban cada año, mientras que los fondos para proyectos fallidos, cancelados o suspendidos (rojo, naranja y amarillo) permanecen sin cambios.
La pregunta "qué categorías fueron exitosas" causó una respuesta visual diferente: Preguntar datos agregados "por categoría, estado del filtro - exitoso" a la consulta anterior y dibujó un histograma de la clasificación de las categorías de Kickstarter por la cantidad de proyectos exitosos en orden descendente.
Los empleados siempre quisieron que el software empresarial hiciera lo que querían, incluso si no podían articular la tarea, y Andrew Vigno demostró que Tableau se estaba acercando a esto. Cuando escribió "comparar con el financiamiento promedio" (literalmente), Ask Data le mostró la extensión en el número de proyectos junto al financiamiento promedio para las diversas subcategorías de proyectos de tecnología que había revisado previamente.
Algunas cosas en Tableau son aún más rápidas de hacer con el mouse, especialmente si escribe lentamente: agregar una subcategoría de "mod" y "juego" al gráfico de dispersión requiere solo cuatro clics.
Crear nuevos modelos de datos
Unos pocos clics es todo lo que su colega Tyler Doyle necesitaba para crear un nuevo modelo de datos que muestre los campos utilizados por Tableau para analizar datos en consultas SQL y que la base de datos subyacente pueda entender.
" Es suficiente para mí hacer clic en una línea:" Agregar objetos relacionados ", y su modelo de datos está listo, sin la necesidad de determinar qué tablas usar, cómo están conectadas, o qué es, unión izquierda o derecha. Las nuevas capacidades de modelado de datos en Tableau lo hacen por usted. "
- Tyler Doyle
“
¿Cómo conoció el modelo de datos las relaciones correctas entre estas tablas? "- se pregunta Doyle. Resulta que Tableau depende de los CIO, así como de sus administradores de bases de datos y profesionales de datos. Para ayudarlo a realizar este truco, debe asegurarse de que la información necesaria esté almacenada en el almacén de datos.
La preparación de datos es otra área en la que Tableau está trabajando. El ingeniero sénior Zahira Valani mostró cómo Tableau Prep puede automatizar la limpieza de datos mediante roles. Tableau los utiliza para identificar campos que desempeñan un papel, como URL, direcciones de correo electrónico o indicaciones geográficas (estados o códigos postales). Valani mostró cómo, en solo un par de clics, Tableau Prep puede verificar el contenido de un campo para determinar el rol más apropiado, y luego seleccionar elementos no válidos que no coinciden con el rol y configurarlos como "nulos" o filtrar estas líneas. Puede hacer lo mismo con roles personalizados, como los tipos enumerados.
Según el director de producto de Tableau, François Eienstat, Tableau Prep se actualizará mensualmente, en lugar de un calendario de tres lanzamientos por año para el software principal de Tableau.
La planificación es una característica de otra herramienta que actualmente se encuentra en pruebas beta en la compañía: Tableau Prep Conductor. Permitirá a las empresas automatizar la preparación de sus fuentes de datos moviéndolas a Tableau de acuerdo con el cronograma elegido. Este es un producto separado de Tableau y requerirá una licencia por separado para usarlo. El inicio de las ventas está programado para el próximo año.