Olá Habr! Apresento a você a tradução do artigo "O Tableau discute a interface de linguagem natural para criar visualizações" de Peter Sayer .
O provedor de BI procura simplificar e automatizar a análise de dados como parte de uma tendência crescente de incorporar recursos de IA (inteligência artificial) nas ferramentas de BI.
Quantos estatísticos são necessários para construir um novo modelo de dados? De acordo com o Tableau Software, de maneira alguma. A empresa afirma que a próxima versão da ferramenta analítica amplamente usada fará isso sozinha.
O Tableau demonstrou isso na semana passada em um novo recurso chamado Ask Data, que permite aos usuários criar visualizações descrevendo o que desejam em linguagem natural. Isso foi feito em um evento para clientes em Nova Orleans. Além disso, a empresa demonstrou novos recursos de automação em sua ferramenta de preparação de dados.
Isso faz parte de uma tendência crescente entre os desenvolvedores de software corporativo de automatizar e simplificar tarefas que antes exigiam habilidades especiais, permitindo que as empresas usem seus dados com mais eficiência e realocem pessoal qualificado para um trabalho menos trabalhoso.
Alvorecer da tecnologia de IA em BI
As conquistas no campo da inteligência artificial tornam mais fácil para os desenvolvedores de software corporativos inserir dados em uma linguagem natural - verbal ou impressa - e exibir as informações de que o usuário precisa, em vez de forçá-lo a aprender comandos específicos ou operar objetos na tela para atingir seus objetivos. A IA está sendo cada vez mais usada nas principais ferramentas de BI na esperança de "democratizar" a análise e a ciência de dados.
O Microsoft Power BI, concorrente do Tableau, introduziu um recurso chamado "Perguntas e respostas" há alguns anos, mas mesmo em demos recentes, a frase parece mais complicada em gramática e ortografia do que o Tableau Ask Data. No entanto, eles estão à frente do Dundas BI e similares, que ainda usam o recurso de arrastar e soltar para criar visualizações.
A implementação do Tableau permitirá que os usuários consultem o banco de dados e forneçam a oportunidade para o software determinar independentemente como as tabelas do banco de dados devem ser combinadas, quais colunas devem ser selecionadas e quais operações devem ser executadas para obter a resposta desejada. Este e outros novos recursos aparecerão no Tableau 2019.1, que deve ser lançado no início do próximo ano, e uma versão beta será lançada no final de outubro.
"
Esses recursos de automação são bem-vindos e necessários ", disse Martha Bennett, analista-chefe da Forrester. "
Estamos obtendo cada vez mais dados, mas as pessoas que trabalham com eles não têm tanto tempo ."
Segundo ela, os especialistas em dados gastam até 80% do tempo preparando dados, e quanto menos tempo gastam neles, mais eles serão capazes de executar as funções de BI que beneficiam diretamente os negócios.
Uma maneira de superar a falta de tempo entre os especialistas é transferir a maior parte da carga de trabalho para as máquinas. Outra maneira é simplificar o trabalho com dados para pessoas que anteriormente não podiam trabalhar com eles por causa da necessidade de ter habilidades especiais. Essa é a chamada "democratização" dos dados.
Desvantagens do uso de IA
"
Mas há riscos no fornecimento de dados para um número maior de funcionários: os dados não podem substituir o conhecimento especializado na área de assunto e a avaliação sóbria das situações ", disse Martha Bennett.
"
Antes de disponibilizar amplamente os novos recursos de automação, os CIOs devem testá-los com sua própria experiência para determinar se são apropriados ", aconselha ela.
Ferramentas que oferecem análise de dados sem recomendações claras podem confundir os usuários com as ações a serem tomadas.
" Se você não der instruções detalhadas a alguém, não espere que ele faça tudo certo da primeira vez ."
- Marta Bennett, analista-chefe da Forrester
No entanto, você não pode apenas culpar o software.
“
Automação não é o mesmo que controle. Todas essas coisas ainda devem ser seguidas. Não vai parecer muito bom no tribunal se você disser que o próprio computador fez isso e não temos idéia do porquê ”
, adverte Martha Bennett. Esse problema é conhecido há muito tempo como o problema da caixa preta da IA.
Além disso, você precisa descobrir se seus dados são adequados para uma ferramenta de automação: em particular, os sistemas de aprendizado de máquina exigem muitos dados para funcionar.
"
Se você aplicar algoritmos de aprendizado de máquina a dados com mais exceções do que o normal, não funcionará ", disse ela.
Detalhes da demonstração
Em um evento em Nova Orleans, o gerente de análise visual Andrew Vigno demonstrou os recursos do Ask Data no banco de dados de projetos de crowdfunding do Kickstarter, mostrando que, diferentemente da maioria dos compiladores, o Ask Data não exige pontuação perfeita para funcionar.
O software transformou sua consulta "qual era o financiamento total" (literalmente) em "a quantidade de financiamento" e retornou uma resposta. Quando ele imprimiu "por anos" e "por status", o Ask Data converteu sua solicitação em "a quantia de financiamento por prazo e por status". Depois, sem dados adicionais, ela preparou um gráfico de linhas coloridas mostrando os financiamentos verdes para projetos de sucesso aumentando a cada ano, enquanto o financiamento para projetos com falha, cancelados ou suspensos (vermelho, laranja e amarelo) permanece inalterado.
A pergunta “quais categorias foram bem-sucedidas” causou uma resposta visual diferente: Ask Data adicionou “por categoria, status do filtro - bem-sucedido” à consulta anterior e desenhou um histograma da classificação das categorias do Kickstarter pelo número de projetos bem-sucedidos em ordem decrescente.
Os funcionários sempre desejavam que o software corporativo fizesse o que queriam, mesmo que não fossem capazes de articular a tarefa, e Andrew Vigno mostrou que o Tableau estava abordando isso. Quando ele digitou “comparar com o financiamento médio” (literalmente), o Ask Data mostrou a expansão do número de projetos ao lado do financiamento médio para as várias subcategorias de projetos de tecnologia que ele havia revisado anteriormente.
Algumas coisas no Tableau ainda são mais rápidas com o mouse, especialmente se você digitar lentamente: adicionar uma subcategoria de "mod" e "game" ao gráfico de dispersão leva apenas quatro cliques.
Criando novos modelos de dados
Alguns cliques são tudo o que seu colega Tyler Doyle precisava para criar um novo modelo de dados que exibe os campos usados pelo Tableau para analisar dados em consultas SQL e que o banco de dados subjacente pode entender.
“ Basta clicar em uma linha -“ Adicionar objetos relacionados ”, e seu modelo de dados está pronto, sem a necessidade de determinar quais tabelas usar, como elas estão conectadas ou o que é, junção esquerda ou direita. Os novos recursos de modelagem de dados do Tableau fazem isso por você. "
- Tyler Doyle
“
Como o modelo de dados conhecia os relacionamentos corretos entre essas tabelas? ”- pergunta Doyle. Acontece que o Tableau depende de CIOs, administradores de banco de dados e profissionais de dados. Para ajudá-lo a executar esse truque, você precisa garantir que as informações necessárias sejam armazenadas no armazém de dados.
A preparação de dados é outra área em que o Tableau está trabalhando. A engenheira sênior Zahira Valani mostrou como o Tableau Prep pode automatizar a limpeza de dados usando funções. O Tableau os usa para identificar campos que desempenham um papel - coisas como URLs, endereços de email ou indicações geográficas (estados ou códigos postais). Valani mostrou como, em apenas alguns cliques, o Tableau Prep pode verificar o conteúdo de um campo para determinar a função mais apropriada e, em seguida, selecionar elementos inválidos que não correspondem à função e defini-los como "nulos" ou filtrar essas linhas. Você pode fazer o mesmo com funções personalizadas, como tipos enumerados.
De acordo com François Ejenstat, diretor de produtos da Tableau, o Tableau Prep será atualizado mensalmente, em oposição a uma programação de três lançamentos por ano para o principal software da Tableau.
O planejamento é um recurso de outra ferramenta atualmente em teste beta na empresa: o Tableau Prep Conductor. Isso permitirá que as empresas automatizem a preparação de suas fontes de dados, movendo-as para o Tableau de acordo com o cronograma escolhido. Este é um produto separado do Tableau e exigirá uma licença separada para usá-lo. O início das vendas está programado para o próximo ano.