内容简介
本书作为 CDA 认证教材打破传统的学院派知识整合模式,从 EDIT(探索、诊断、指导和工具)数字化模型的角度进行叙述,在传授知识理念的同时,还讲解了进行商业数据分析时应遵循的整体思维和思考方式,以达到将企业分析模型与数据分析方法相结合、使用科学的方式进行数据分析的教学目标。
本教材整体分为三篇,分别是原理篇、技术篇和管理篇。第一篇共 5 章,首先讲解数据分析思维,进而介绍数据分析方法和商业数据分析框架,之后阐述战略数据分析和业务数据分析。第二篇共5 章,包括描述性统计分析、指标体系构建方法、SQL 语言基础与 MySQL 入门、用户标签体系与用户画像专题、简单时间序列分析方法。第三篇共 3 章,包括数据治理、数据模型与数据建模、指标体系管理。
目录
前言/序言
CDA,数智人才的身份认证
数据曾经被视为商业“尾气”,如今却已成为世界的“石油”。借助合适的模型、算法、技术,我们可以从数据中挖掘巨大的商业价值。数据分析极大地促进了现代服务业、制造业差异化竞争格局的形成,将来更会成为各行业获得竞争优势的助推力。
数据分析的主要目标之一就是满足组织的业务运营需求,为业务服务。大部分组织经历了从以产品为中心到以客户为中心的转变,其数据分析的重点也从关注组织经营结果转向进行全方位的组织运营和客户洞察,分析方法也从以管理报表为主,到对微观个体进行行为洞察和预测。另外,IT 技术的发展使得组织能够以更低的成本存储和处理大量数据,从而推动分析视角从宏观的业务层面逐步深入到个体微观层面。分析中的数据范畴也从基本属性和时点状态数据逐步扩展到行为数据,分析技术从传统的统计分析逐步向机器学习和深度学习过渡。
满足业务运营需求更本质的目标,是通过数据分析改变决策方式,从依靠经验转向依靠数据。在当前,数据分析是学习型组织的重要表现形式。学习型组织的能力建设有两个主要阶段,分别是隐性知识显性化阶段和显性知识算法化阶段。前者是概念明晰和逐渐量化的过程,后者是提取知识形成算法并固化在业务流程系统中的过程。组织的核心能力从“以人为核心”转变到“以算法为核心”。通过数据分析进行科学决策、自主决策,从而实现业务价值,使数据分析在决策过程中不可或缺,逐渐成为组织的核心竞争力。
CDA 数据科学研究院经过多年在数据分析领域的深耕,建立了 CDA 数据分析师认证体系,为企业实现宏观与微观相结合的数字化转型提供有力支持,并为企业提供了坚实的数字化人才保障。
CDA 数据分析师认证体系与企业管理工具“平衡计分卡”相得益彰,涵盖绩效分析、客户分析、流程分析、智能学习,助力企业实现宏观与微观相结合的数字化战略中心组织。在平衡计分卡中,前面的分析为后面的工作指明方向,后面的活动为前面目标的实现提供能力支持。而 CDA 体系把“平衡计分卡”中最基础的“员工学习”活动与“机器学习”相融合,强调如何将业务知识以算法的形式固化在系统中,以更适合数字化时代的诉求。
基于先进企业的实践,CDA 数据科学研究院提出了企业数字化需要具备的数据人才能力的模型。企业中的数据分析任务分为业务现状描述、问题归因分析、个体行为预测,这就要求数据人才具备描述现状、分析原因、预测行为的能力。数据人才的范围也不限于数据分析师和数据挖掘工程师,还包括经营决策人员和业务骨干。
业务问题归因分析和策略优化是企业中数据分析任务的核心,对上游的现状描述提出建立完备的指标体系和报表可视化的需求,对下游的预测分析提供算法模型的应用场景。CDA 数据分析师认证体系根据归因分析和策略优化的应用深度,以及从宏观业务分析到微观个体预测的技术难度,设计了 CDA 一级认证教材至三级认证教材的学习内容,并对各类分析工具的掌握提出了相应的要求,通过分级课程来帮助数据人才全面掌握从业务问题归因到策略优化的能力。
CDA一级认证教材主要讲解商业分析所涉及的指标体系构建方法、用户标签体系和用户画像专题、描述性统计分析等技术;CDA 二级认证教材主要讲解客户运营、流程分析和策略优化所涉及的用户高级标签的构建、模型归因分析、预测模型等业务宏观分析与客户微观洞察相融合的技术;CDA 三级认证教材主要讲解企业数据挖掘体系的构建,在机器学习运营(MLOps)的框架下设计、开发、落地数据挖掘模型,包括机器学习经典算法及案例、算法模型管理等技术。CDA 认证教材在工具实现上选择企业中应用最为广泛的数据库语言SQL和编程语言Python 等。
很多企业将 CDA 证书作为企业内部数据分析人才的评定标准和招聘要求。这套教材旨在帮助读者形成体系化、专业化的数据分析思维,通过 CDA 认证,为其职业发展提供更多可能性。
无论读者是否参加认证考试,这套教材都是理解和应用数据分析的宝贵资源。常读常新,体会数据分析之美,灵活运用教材中的分析方法和案例,让数据分析和实证研究相得益彰,让数据分析和业务经验优势互补。这套教材将在数据分析行业中产生影响,如春风化雨般滋养各个领域中孜孜不倦的数据分析学习者和从业者,在数据分析的新理念、理论、方法、技术及工具等方面,为他们提供知识支持与启发。