第九届CDA认证考试在去年12月底圆满地落下了帷幕,按着国际惯例在每届考试后,我们都会采访考试中名列前茅的考生,分享他们的备考经验和心路历程。那么有心的小伙伴可能注意到了,在以往的状元采访中,唯独 Level 3 都是空缺的,这是为什么呢?我们都知道CDA认证分为CDA Level 1,Level 2 和Level 3,其中Level 3 数据科学家的含金量最高,考试难度也是最大的,一直以来还未曾有人能通过。不过在这次第九届CDA认证考试中,迎来了唯一一名Level 3通过者,他也是通过CDA认证的第一位数据科学家!
那么究竟是怎样的“大神”才能通过Level 3 考试呢?今天就让我们走进CDA Level 3 的首位数据科学家曾津,看看他是如何一步步备考和学习,最终通过CDA认证考试的最高认证的。
Level 3 数据科学家 曾津
去哪儿网资深数据产品经理,中央财经大学财政学硕士。目前主要负责在哪儿网机票服务平台、用户产品部用户画像及BI系统建设与应用,有多年数据分析及实战经验。
Q1:请介绍下您的教育背景以及目前从事的工作
我并非数据分析科班出身,甚至是一个文科生。本科和硕士分别毕业于北京工商大学和中央财经大学,所学专业都是经济学中的财政学,是一个偏向文科的专业,貌似跟大数据没有什么关系。后来参加工作以后,先后在咨询公司、游戏公司做过研究员和商业分析相关的工作。数据分析及数据挖掘的经验是在后来的工作中学习和实践中积累的。
目前我在去哪儿网机票事业部担任资深数据产品经理,管理一只十余人的数据产品团队。主要负责去哪儿网机票的用户画像及建模、数据分析、BI系统建设等工作。在工作中,我们用到的数据分析的技能主要是三个方面。一是数据挖掘建模,我们数据产品主要利用R语言和python做数据分析及建模工作。二是商业分析技能。三是数据仓库及数据获取方面的技能,SQL、Hive等。
2. 您报考CDA认证考试的契机是什么?
目前大数据方面没有国家统一的考试认证,CDA对数据分析师的技能体系有比较完善的设计。特别是CDA Level 3,要求全面,可以通过考试复习的过程完善自己的知识体系和技能树。
3. 请聊聊您考试的心路历程,比如如何一步步从 Level 1 /Level 2 考到 Level 3的。
我两年前参加过CDA Level 2 建模分析师的考试,对于CDA并不陌生。当时通过备考,帮助自己查漏补缺完善知识短板,受益颇丰。
因此一直关注CDA Level 3 的报名信息。今年CDA Level 3报考一开放我就报了名。
数据科学家的要求是综合全面的,在复习过程中,我深深的发现自己在理论知识方面的不足,也通过复习修补了自身的技能树。而且数据科学家考试所要求的知识量很大,也提升了自己合理安排时间和对抗压力的能力。
CDA Level 3 第二阶段考试是案例考试部分。很荣幸李御玺老师是我的答辩考官。李御玺老师和蔼认真,针对我的案例给予了细致耐心的评价,并且指出了我建模过程中的不足,希望我对于模型的解读与应用更加关注,使我受益匪浅。
4. 您是备考的,是如何平衡工作和学习安排的?
由于平时工作比较繁忙,我能够利用的时间只有平时晚间10点半到12点的这每天的1.5个小时以及周末的时间,因此在优先级排定和分阶段学习方面做了一些功课:
(1)优先级排定
我首先根据自身基础针对大纲中的内容进行了优先级和复习策略的排定(如下图)。
比如我个人对于机器学习和深度学习的大部分内容相对比较熟悉,而这一部分分值占接近50%,也是重点内容,对应上面第一象限,需要全面通读、查漏补缺。通过学习梳理,我对SNA、强化学习和类别不平衡等内容有了更系统的认识。
而计算机科学技术(分值15%)和大数据架构(15%)是我所不太熟悉的内容(因为我是数据产品序列而非数据开发序列),对应上面的第二象限,这就需要重点攻关了。这一部分备考花费了我超过40%的时间和精力。
还有像深度学习在人脸识别、物体监测方面的应用,占比分值只有1%,自己也不太熟悉,如果这些内容要深究的话,需要花费大量的时间,属于第三象限,因此了解即可。千万不能钻牛角尖。
(2)分阶段学习
CDA Level 3 内容较多,最好至少提前三月开始复习。我个人是从9月开始正式进行复习的。
第一阶段:初轮复习(2018.9-2018.11)将书中知识通读、消化,大纲中的每一部分形成脑图,便于自己系统掌握。
第二阶段:专题突破(2018.11-2018.12中旬)针对薄弱专题重点学习
第三阶段:冲刺复习(2018.12中旬至靠前)主要是记忆为主。
5. 您有哪些推荐的书籍和课程
在复习CDA Level 3 的过程中,一定要紧扣考试大纲。可以结合大纲查阅网上资源+精读经典书目的方式进行学习,也可以关注CDA官方的一些直播和视频(李御玺老师考前曾有过《机器学习》方向的直播课,与考试内容相合)。
《深度学习》,出自Goodfellow、Bengio 和 Courville 三位大牛之手,一定要精读。
周志华老师的《机器学习》浅显易懂,体系完善,可以根据大纲中要求的内容学习(CDA Level 3 的机器学习部分和CDA Level 2 建模分析师的机器学习部分有较大差异,因此在复习的时候只看CDA Level 3 大纲要求的部分即可)
另外《R高性能编程》和《社会网络分析方法与实践》对我日常的工作有较大启发。
6. 给备考者们的建议
CDA Level 3 对考生的理论基础的扎实性和全面性有很高的要求,内容涵盖广泛,参考书目有十数本,加起来有一尺多厚……所以有三点建议分享给大家:
(1)一定要吃透考纲
考纲要求的要掌握,考纲不要求的一定放弃,不要纠结,不要浪费时间。时间是非常有限和宝贵的!可以根据考纲中给出的分值占比来分配自己的时间和精力。
(2)要有学习计划,控制好学习节奏
比如今天计划要通读某本书的某章节就一定要完成;找好节奏,比如有初轮复习、二轮复习和冲刺复习(比较像高考)。
(3)注意学习方法
在通读阶段,我会将书中的内容绘制成脑图,帮助自己更好的记忆和理解知识点中的关联;又譬如为了利用好碎片时间,我会将知识点进行录音,在碎片时间中放2倍速听,加深印象。
以上就是我的备考历程了,也希望各位考生在考试和学习中找到最适合自己的方法,一开始可能会有些难度,但是只要你端正心态,坚持下去,相信你一定能取得理想的成绩!
ps. 去年我坚持跑步健身瘦了40斤,这可能是我在去年做的最有成就的事情之一了(笑),与大家共勉!