第九届CDA认证考试,在2018年12月底圆满地落下了帷幕。近日,我们采访了在本届考试中名列前茅的几位优秀学员,在之前我们采访了Level 1 和Level 2 大数据方向的状元们(点击查看之前的采访),这次让我们走进Level 2 建模方向的前三甲,看看他们是怎样学习和备考的呢?
Level 2 建模 · 状元 蔡晓静
2017年毕业于北京工业大学信息与计算科学专业
报考CDA认证考试的契机
我目前的工作中用到数据分析的地方不多,但由于本身所学专业和数据分析相关,自己对这方面也比较感兴趣,未来也有转行的想法。考虑到CDA认证考试在数据分析行业的含金量和的专业性,最终选择了报考。
我是如何备考的
在备考中,我觉得最难的应该是工作和学习的兼顾,参加工作后不想学生时代那样能很快投入学习状态。在这个过程中特别需要坚持和意志力。
准备考试我大约提前三个月开始复习和准备,首先需要制定计划,规定每天要看多少内容。而且提前让自己适应学习的环境是很重要的。
1. 考纲非常重要
重点知识考纲上都有罗列,始终以考纲为主。可以把考纲打印出来,边记笔记边学习,毕竟好记性比不过烂笔头嘛。
下面是我的考纲笔记~
2. 灵活利用时间
因为是上班族,所以我会利用休息间隙的零散时间学习。每天下班后再集中时间攻克较难的知识点,每天大约花3到4个小时学习。
在最后两周建议针对考纲知识点巩固、理解、查漏补缺。吃透每一道题,解析每个选项。
推荐的课程
我报名了《CDA Level II 建模分析师》的课程,我觉得跟着视频学习是最有体系的,一整套学习下来,跟着老师讲的重点记笔记。
给备考者的建议
针对备考的同学们,我主要有以下三点建议。
一、打好基础很重要。打好基础考试中的难点理解起来会相对简单,如果只顾着攻克难点的话,那就得不偿失了。
二、要采用最适合自己的学习方式。想通过考前突袭复习是不太可能的,最好要提前早点开始复习,毕竟计划赶不上变化,提前让自己适应学习的状态,否则后期很难坚持下去。
三、要有信心。在心态方面别吓自己,给自己信心,在好好学习的基础上,考试并不太难。其实我就是按制定的计划,一步步踏实备考的,得知自己考了状元还有点小意外(笑)。所以一定要给自己信心,相信自己一定可以的。
今后的职业发展规划
希望能把数据分析所学知识应用到现在的工作中,未来可能会考虑转行。
Level 2 建模 · 榜眼 屈孝龙
目前从事的工作
我在四川电信做后端维护工作,原来负责业务平台维护,现在往开发和大数据方向发展,目前在尝试做网络设备告警的关联分析。
报考CDA认证考试的契机
公司之前组织过一些关于数据挖掘分析的培训。这次报考CDA,主要是想了解自己学习情况和当前水平,同时再重温基础知识,梳理知识结构。
我是如何备考的
我在11月份参加了为期一周的考前培训,基本上是围绕CDA课件展开的。
考试前一周开始恶补李玉玺老师的视频课程,跟着视频学习的同时,我还结合课件进行细化,认真掌握每一个知识点。
同时考前3天左右有李玉玺老师的直播课程,是关于考前准备和学员的答疑,还是很重要的。
推荐的书籍和课程
考试主要根据考纲,认真学习CDA官网上提供的课件和李玉玺老师的课程视频。不要错过任何细节。
系统学习的书:
《数据挖掘概念与技术》(比较难啃)
《机器学习》周志华的西瓜书(稍微好啃)
考试中有哪些知识难点
实操题的评价指标不是传统的分类正确率,而是根据profit指标得到两个结果。这个知识点我之前没接触过,结合李玉玺老师的视频内容,反正研究理解,并完成代码。
给备考者的建议
1. 首先要系统学习KDD的过程,其中数据预处理和建模是重中之重。这两者相辅相成,是一个不断迭代完善的过程。了解其中的主流算法优缺点和应用场景是必须的。
2. 一定要实战,不能纸上谈兵。不管用什么工具,Python、R等等,只有不断的通过实例操作才能更深的理解知识。
3. 不光要学,还要找地方用。说到底,数据挖掘只是一个工具,就好比现在的电脑,如何运用工具解决实际问题,才是最有用的。结合工作和生活,找到数据挖掘的应用场景,这样学习动力才更足。
4. 考试方面,一定要看考前的直播,老师会讲一些考试细节,这是书本上没有的。另外,客观题没啥好说的,就是平时的积累。实操题,请把训练模型都准备好,主要包括缺失值(离散、数值)填充、数值离散化或者规范化(结合模型)、数据编码、模型选择(推荐随机森林、xgboost、SVM等强分类器)等等。实操虽然有2个多小时,但基本上没时间对每个特征属性逐个分析。建议先比较粗的进行预处理,通过模型打分,选择合适的模型,然后再根据选中的模型进行较细的预处理尝试,看准确率是否有提高。
今后的职业发展与规划
数据挖掘我也才刚刚起步,还有很多东西需要补充。希望自己结合在工作上的实际问题,用数据挖掘这个工具,找寻一条全新解决问题的方向。
Level 2 建模 · 探花 刘星宇
目前从事的工作
目前毕业两年,专业是农学类,因对数据感兴趣,在毕业后学习数据相关知识。之前在互联网金融公司担任数据分析,目前正处于离职状态,本次考试也是自己休息调节中的一次充电。
报考CDA认证考试的契机
希望可以通过考试来监督自己学习,同时也想通过相关证书来证明自己,由于目前并没有国家统一的考试,而CDA被越来越多的专业人士及公司认可,所以我选择了CDA。
我是如何备考的
本人对机器学习比较感兴趣,在考前几个月就有通过自学来巩固机器学习算法方面的知识。在考前20天的时候开始参照大纲进行针对性的复习,并且在考前一周利用网上的模拟数据集进行实操练习。
推荐的书籍和课程
算法方面有看李航的《统计学习方法》。工具方面个人比较喜欢Python,推荐跟着视频课程学习并练习代码。
给备考者的建议
个人觉得模型最后的评判标准很重要,平时接触到的评判指标一般是KS,Recall等,但本次考试使用的评判标准是Profit。以前没有了解过这种评判指标,所以在考前花了不少时间针对这个指标做建模练习。针对不同的评判指标,不同的数据集应该采用不同的建模方法。
今后的职业发展规划
目前本人正在休息调整中,之前的工作主要是数据分析方面,年后希望从事数据挖掘方面的工作,这样可以将自己所学的知识更多的运用到实际中去,利用机器学习等知识来提供更多可行性的预测,对客户有更好的评估,减少客户流失等。