Publicação da apresentação na seção de R meetup @ Moscow Data Science Major (primavera de 2019) .
Toda a apresentação está em formato pdf .
Por que essa pergunta é relevante?
Os casos de negócios são diferentes, a essência técnica é a mesma
- Análise de desempenho da central de atendimento
- Análise de vendas, incluindo previsões
- Sistema antifraude
- Mineração de processos de negócios
- Várias auditorias (técnicas, financeiras)
- Tarefas de armazenamento e logística
- Custeio baseado em atividades
- Monitoramento de processos de negócios
- Análise baseada em log
- Gerenciamento de capacidade
- Análise de texto (email, central de atendimento)
- Painéis e relatórios flexíveis
- "pneus inteligentes" entre sistemas contábeis (1C, ACS, SAP, ...) e executivos
- ...
É uma continuação de publicações anteriores .
Observações práticas
- muitas dessas tarefas se resumem à manipulação matemática de dados (os sistemas CRUD estão além do escopo, consideramos precisamente vários processos e transformações);
- 80% das tarefas de manipulação de dados podem ser resolvidas de forma rápida e eficiente "chave na mão" usando as ferramentas R;
- nos negócios, como regra, as tarefas e os requisitos são rapidamente ajustados, incl. devido a fatores externos ou resultados intermediários obtidos;
- tecnologias "modulares" se enraízam em TI; a construção do "monólito" pode levar de 2 a 3 anos, o que é comparável à vida de uma pequena solução. É muito mais eficiente montar rapidamente um design “modular”, ganhar experiência prática e, em 2 a 3 anos, criar uma nova solução levando em consideração o conhecimento adquirido e as mudanças passadas em TI e negócios.
"Lendas urbanas" típicas sobre R
- R lento
- R difícil de ler
- R é para stat. cálculos por algoritmos complexos
- R foi projetado para uso interativo.
Tudo isso decorre de um estudo superficial do tópico e das ferramentas utilizadas.
Lendas da cidade - equívocos dos anos 90
- R é uma linguagem de programação completa, não uma calculadora de console.
- O R funciona bem como uma "cola" universal entre várias plataformas e componentes C - conta rapidamente!
- A legibilidade do código depende da experiência do desenvolvedor. O estilo moderno de R é metaprogramador. O código é compacto e rápido.
- R é um ecossistema que permite implementar um ciclo completo de processamento de dados, desde a importação de dados até o fornecimento de AWPs e a preparação de apresentações.
Publicação anterior - "Usando o poder computacional de R para testar a hipótese de igualdade de médias" .