考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

关于 CDA

大纲更新

自2014年起,每年不定期更新
2024
2023
  • 新增 ● Level 1 的业务分析部分更新以下案例:
    新增 1)违约用户特征分析案例
    新增 2)优衣库区域销售分析案例
    新增 3)客户评价分析案例
    新增 ● Level 1 加入数据治理内容
    新增 ● Level 2 加入数据治理内容
    新增 ● Level 2 的数据可视化挪到Pandas模块
    新增 ● Level 1 人工智能模块去掉fine tuning,增加模型部署
    新增 ● Level 1 增加数据分析案例并单独列出,替换人工智能案例
    新增 ● Level 2/3增加数据模型管理的内容
    新增 ● 更新Level 3的Spark内容模块
    新增 ● Level 3增加调参进阶的内容
    新增 ● Level 3去掉谱聚类,增加高斯混合模型的Spark内容
    新增 ● Level 1 BI模块新增Fine BI和Yonghong BI的内容
    新增 ● Level 3删除CatBoost相关内容
    新增 ● Level 3增加Lora和Lang Chain相关内容
  • 新增 为适应现在企业中对于数据分析的需求变化,特对Level 1的学习内容进行重大改变并增加人工智能的内容。以聚焦现在企业中真正需要的数据分析技能。
    新增 ● Level 1增加人工智能内容
    新增 ● Level 1的财务数据分析单独作为一个模块
    新增 ● Level 3去掉svm等过时算法
    新增 ● Level 3增加LLM大量内容
  • 新增 ● Level 2 ETL模块增加Pandas实现
    新增 ● Level 1统计学模块增加二项分布的商业案例
    新增 ● Level 3决策树模块增加回归树的案例分析
    新增 ● Level 3集成学习模块修改文字描述
    新增 ● Level 3深度学习模块增加人工智能与大语言模型
  • 新增 ● Level 1 更新分析报告内容
    新增 ● Level 2 更换为Python实现ETL
    新增 ● Level 3机器学习更新文字描述
    新增 ● Level 3删除MLflow内容
    新增 ● Level 3的NLP部分新增GPT与Fine-tuning/Prompt内容
2022
  • 新增 高速收费数据分析项目(侧重实现企业数据仓库的多层级应用 ODS\DW\APP层)
    新增 环形饼图的知识
    新增 推断统计python案例
  • 新增 窗口函数的应用
    新增 网格搜索、随机搜索、贝叶斯搜索
    新增 C4.5,cart树处理离散型和连续型数据的例子和处理逻辑
    新增 单颗树分类结果的概率
    新增 分类模型评估指标如Ks 、PR、roc、混淆矩阵等
    新增 重心法,全联接法的例子讲解
    新增 建模流程
    更新 pyspark中的SparkSQL部分
  • 新增 统计学增加了统计图表的内容:直方图、条形图、饼图,箱型图、散点图等,添加了练习题和二项分布
    新增 孤立森林、LOF 的数学背后原理,公式、超参数和小案例
    新增 增加 smartart 组件
    新增 Transformers 案例,实现自动问答与自动摘要
    更新 聚类进阶和异常识别
    更新 聚类分析、决策树应用内容,调整内容的知识的逻辑顺序
    更新 python 自动化办公和 python 风控报表自动化代码,其中办公自动化用五个 excel表格批量自动化案例替换了之前的爬虫内容,与爬虫相比,Excel 处理更贴近实际需求
    更新 风控报表自动化中的数据处理部分把sql代码替换成 python 代码,绘图部分代码替换成 matplotlib 库
    更新 线性回归模型案例方法
    更新 逻辑回归案例
  • 新增 涵盖统计建模+机器学习
    新增 ETL 内容
    新增 增加评分卡和反欺诈实战案例
    新增 增加 SPSS 内容
  • 新增 ETL大量内容
    新增 Pipeline 工作流内容,此内容为 CDA 独家
    新增 MLOps 内容,此内容为 CDA 独家
    新增 模型可解释性专题,此内容为 CDA 独家
    新增 CatBoost, NGBoost,后者是现在的前沿算法之一,此内容为 CDA 独家
  • 更新 统计学新增内容
  • 新增 文字描述做了大大优化
    新增 集成学习中增加随机森林的 Spark 实现
  • 新增 增加预训练与 Bert 的内容,框架更换为 PyTorch
    更新 Level III 改为"深度学习与 NLP 前沿技术”
  • 新增 推断性统计
    新增 AB test 内容
    更新 原数据产品设计课程更换为精准营销全流程
  • 新增 增加 AB test 内容
    新增 在正则回归和协同过滤的课程中增加 Spark 的模型实现
    新增 NLP 中增加 Attention、Transformer、Bert 内容
    更新 深度学习课程中去掉径向基网络,改为残差网络
2021
  • 新增 数据治理
    新增 企业架构与数据架构基础
    新增 商业策略分析
    新增 数字化最优化工作方法
    新增 CDA 数据分析师 App 上线
2020
  • 新增 大数据隐私、安全及立法
    新增 区块链分析
    新增 项目管理
    新增 案例:深度学习在影像物体辨识上的应用
    新增 案例:深度学习在手写数字辨识上的应用
2019
  • 新增 大数据存储与计算
    新增 集群资源管理与调优
    新增 基于Tensorflow、Keras、Scikit-Learn、TFLearn的机器学习算法
    新增 感知机与神经网络
    新增 每一个阶段都有相关的作业练习与项目案例
    更新 毕业答辩涉及大型商业项目
  • 新增 好学 AI
    新增 Mahout
    新增 Hbase
    更新 机器学习
2018
  • 新增 语音分析
    新增 财务数据分析
    新增 Hive 工具操作
    新增 Power BI 数据可视化分析
    更新 大数据实验室在线编程环境 v2.0,实验室涵盖 SQL、Spark、R 语言、Python 等语言操作工具
2017
  • 新增 数学基础
    新增 关系型数据库
    新增 非关系型数据库
    新增 机器学习
    新增 深度学习 TensorFlow
    新增 文本分析
    新增 图像识别
    新增 语音分析
    新增 对抗生成网络智能问答系统
2016
  • 新增 大数据平台分析工具 Spark
    新增 可视化工具 Tableau 及报告撰写
    新增 Scala 开发
    新增 MapReduce工作原理
2015
  • 新增 大数据实验室 v1.0
    新增 Hadoop 2.X 集群部署
    新增 大数据仓库 HiveQL
    新增 Pyspark 应用
  • 新增 Excel 数据处理技巧
    新增 Power BI
    新增 数理统计
    新增 Python 编程基础
    新增 Numpy 基础
    新增 Pandas 应用
    新增 Python 推荐系统
    新增 Tableau
2014
  • 新增 数据预处理
    新增 Python 大数据工程师
2013
  • 新增 包括 Excel、SQL、SPSS、 R 语言、SAS 等软件应用
    新增 统计基础、业务数据分析
    新增 R 数据可视化

教材勘误

CDA LEVEL I 精益业务数据分析
CDA LEVEL II 商业策略数据分析

P165页 第 3 章 数据库应用,第一条代码中的注释信息,将“若公司有sales的部门”改为“若公司有20部门”。
原段文字替换为:比如我们要查询公司部门编号为20的员工的信息,若存在编号为 20 的部门(也就是在dept 表中存在记录),则返回编号为 20 的部门的员工情况,代码如下:-- 查询公司部门情况,若公司有编号20的部门,则返回该部门的员工信息。

P200页 第 4 章 描述性统计分析,第二道例题答案,将“G^2=3×4=12,故G=√14≈3.464。”改为“G^2=3×4=12,故G=√14≈3.742。”

P212页 第 4 章 描述性统计分析,表4-9 某班某次考试成绩等级的频数分布表,将表中“性别”改为“等级水平”。

P233页 第 4 章 描述性统计分析,将1.696改成1.96

P364页 第 8 章 CDA职业发展,图8-3 CDA持证人薪资对比(单位:元),将图例中非持证人的图例颜色改为灰色。

P68页 第 2 章 表格结构数据与表结构数据,章节练习题的单选题第19题,选项D改为“度量被维度筛选”。

P28-29页 第 2 章 表格结构数据与表结构数据,将13684改为16384。

P376页 附录B练习题答案与解析,第 19 题答案改为 “B”,解析改为“维度是业务观测角度,而度量是业务行为结果,所以描述错误的是 B”。

P157页 第 3 章 数据库,将int改为varchar(20)。

P203页 第 6 章 用户标签体系与用户画像,答案改成“ACD”,去掉“所有选项表述均正确。

P203页 第 6 章 用户标签体系与用户画像,解析中“场景类”改成“预测类”。

P224页 第 7 章 使用统计学方法进行变量有效性测试,“(3-1)”改成“(2-1)”。

P96页 第 4 章 数据采集与数据预处理,公式修改如图。

P268页 第 7 章 使用统计学方法进行变量有效性测试,改成“特异度”。

P121页 第 4 章 数据采集与数据预处理,公式如图修改。

P65页 第 3 章 指标体系与数据可视化,改成“data”。

P68页 第 3 章 指标体系与数据可视化,改成“1000”。

P9页 第 1 章 EDIT 模型概述,“年龄”改为“职业”。

P375页 第 11 章 运筹优化模型,最大化与最小化位置互换。

P377页 第 11 章 运筹优化模型,将“m1”同时设置为下标。

P336页 第 9 章 用户分群方法,去掉 “和R方”。

P364页 第 10 章 业务流程分析与流程优化,改成 “有一定的局限性”。

P136页 第 5 章 宏观业务分析方法,“维度规约”改成“维度归约”。

P227页 第 7 章 使用统计学方法进行变量有效性测试,“t-2”改成 “n-2”。

P296页 第 8 章 使用时间序列分析方法做预报,空格中增加文本,“累计”改为“累积”。