在R Meetup @ Moscow Data Science Major的部分中发布演示文稿(2019年春季) 。
整个演示文稿均为pdf格式 。
为什么这个问题有意义?
业务案例不同,技术实质相同
- 呼叫中心绩效分析
- 销售分析,包括预测
- 反欺诈系统
- 业务流程挖掘
- 各种审核(技术,财务)
- 仓储和物流任务
- 基于活动的成本核算
- 业务流程监控
- 基于日志的分析
- 能力管理
- 文本分析(电子邮件,服务台)
- 灵活的仪表板和报告
- 会计系统(1C,ACS,SAP等)与执行人员之间的“智能轮胎”
- ...
它是以前出版物的延续。
实际观察
- 许多这样的任务归结为数据的数学处理(CRUD系统超出了范围,我们精确地考虑了各种处理和转换);
- 使用R工具可以快速有效地解决80%的数据处理任务“交钥匙”;
- 在业务中,通常,任务和需求会快速调整,包括 由于外部因素或获得的中间结果;
- “模块化”技术已在IT中扎根。 “整体”的建造可能需要2-3年,这与小型解决方案的使用寿命相当。 快速组装“模块化”设计,获得实践经验,并在2-3年内考虑到所获得的知识以及IT和业务的过去变化,构建新的解决方案效率更高。
关于R的典型“城市传说”
- R慢
- R很难读
- R是stat。 通过复杂算法进行计算
- R设计用于交互使用。
所有这些都来自对主题和所使用工具的肤浅研究。
城市传奇-90年代的误解
- R是一种完整的编程语言,而不是控制台计算器。
- R可以很好地充当各种平台和C组件之间的通用“胶水”-它很快就可以计数!
- 代码的可读性取决于开发人员的经验。 R的现代风格是元编程。 该代码紧凑且快速。
- R是一个生态系统,可让您实施从导入数据到提供AWP和准备演示文稿的完整数据处理周期。
先前的出版物- “使用R的计算能力检验均值假设 。 ”