数据科学专业是近几年新兴的专业,目前各个高校的研究生专业中都有涉及到,它是计算机科学下的一个具体的分支专业。
(资料图)
这两年数据科学专业可以说是越来越火了,近两年有更多的院校开设了数据科学专业相关的课程,甚至被纳入英国内政部紧缺职业清单,该专业的毕业生无论是选择在英国求职还是回国发展,都有着非常广阔的就业前景。
什么是数据科学?
数据科学Data Science是从数据中提取知识的研究,关键是科学。起初叫"datalogy"。最初在1966年由Peter Naur提出,用来代替"计算机科学"。
数据科学集成了多种领域的不同元素,包括信号处理,数学,概率模型技术和理论,机器学习,计算机编程,统计学,数据工程,模式识别和学习,可视化,不确定性建模,数据仓库,以及从数据中析取规律和产品的高性能计算。数据科学并不局限于大数据,但是数据量的扩大诚然使得数据科学的地位越发重要。
数据科学的从业者被称为数据科学家。数据科学家通过精深的专业知识在某些科学学科解决复杂的数据问题。不远的将来,数据科学家们需要精通一门、两门甚至多门学科,同时使用数学,统计学和计算机科学的生产要素展开工作。所以数据科学家就如同一个team。
数据科学使用到数学、统计、信息科学和计算机科学等各个学科的技术和理论,特别是以下分支:机器学习、分类、聚类分析、数据挖掘、数据库和可视化。大多数院校的Data Science属于STEM学科。
数据科学主要研究内容有以下三类
Predictive Analytics
分析数据来预测未来可能发生的事情
Descriptive Analytics
分析数据找出过去事件的特征和正在发生事件的趋势
Prescriptive Analytics
分析数据来找出最佳措施、取得最优化的结果
海外专业分支与课程设置
大数据专业是横跨数学、计算机、金融还有商科等专业的交叉学科,目前英美等国家开设的大数据专业方向主要是四个方向:
1、数据科学 (Data Science)
将数学和统计学课程作为核心,搭配以SQL和Python等编程技能课程,包括数据架构,到计算机工程,再到编程等;
2、商业分析 (Business Analytics)
商业分析硕士学位专注于数据应用,以研究消费者、市场和世界经济趋势;
3、信息系统 (Information Systems)
大多数信息系统是基于现成的计算机架构、语言和系统进行的信息收集、组织和整合的工作,信息系统的硕士学位课程通常面向对商业环境中的技术管理岗位
4、运筹学和相关工程学 (Operations Research)
该专业的学习采用如数学建模,统计分析和数学优化,运算研究来为复杂的决策问题找到最优的解决方案;
商业分析从它的名字就可以看出来,这个专业会包含一些商科类型的课程,比如说管理课,经济学课等等。数据科学主要针对的就是统计、数据科学这些方向的。机器学习就是我们人学习到东西之后,需要让机器学习,并帮我们去处理大量的数据等等。
这四个专业的必修课内容都是相似的,主要学data science、统计学、还有一些教数据可视化处理的课程。其他的选修课就大同小异,就算是相同的专业,在不同的院校开设的选修课也是会有区别的,大家可以根据自己的喜好或者职业发展方向去进行选修课的选择。
上图很直观的表达了数据科学作为一门交叉学科的知识结构组成,也符合了大部分项目的课程设置。数据科学是在数据基础之上,运用计算机和数理统计的知识,在某一个具体领域(商业、IT、医疗等)解决具体问题。
核心课程
数据科学中的计算机系统
Computer Systems for Data Science
数据科学中的机器学习
Machine Learning for Data Science
数据科学中的算法
Algorithms for Data Science
数据科学中的统计与概率论
Probability and Statistics for Data Science
探索性数据分析和可视化
Exploratory Data Analysis and Visualization
统计推理与建模
Statistical Inteference and Modeling
数据科学大作业
Data Science Capstone and Ethics
海外申请
数据科学专业是近几年才刚刚新兴的专业,本科阶段少有开设,所以它招生的专业范围是非常广,比如计算机、统计学、数学甚至经济学、工商管理、会计学、市场营销等等,也都是可以去申请数据科学专业的。
如果本科专业是数学、计算机科学等相关度高的专业,在申请时大家要好好在自己的相关课程、研究经历上做功课。如果本科专业相关度低,就需要通过非学校经历,比如网络课程、编程竞赛、科研经历等来证明你的能力。或本科阶段的选课建议需要涉及计算机编程的课程,比如JAVA、Python,还有统计学,数学等,不需精通但建议多少要了解一些。
前期留学准备
主要是分为硬实力和软实力两个部分
硬实力一般指的是三维成绩以及一些能够量化的标准:
英语:去学校官网查询雅思或者托福要求,语言成绩是硬性标准,要重视起来提前做好准备。
GPA:是申请中的重点,data science 是math stats和computer science的结合,有涉及这两个学科的课程且成绩比较好,对于申请是非常有帮助的。
软实力包括推荐信、文书、ps以及科研实习经历等:
推荐信:大部分的学校都至少需要两到三封推荐信,你的任课老师,实验室做科研的教授,你实习的上司,都可以是推荐信的来源。这里有个公式:大牛强推>写得出彩的强推>其他;可以看出推荐信最重要的是推荐人的地位和可信度;
实习:实习的关键不在多在于“精”,申请专业相契合的实习比公司名头重要的多;
科研:高含金量的科研经历,一定是录取的加分项,能够让学校清楚的认识到你对这门专业的热情、以及你所具备的学习这门专业的能力,也是能够帮助你从众多同质化申请学生当中脱颖而出的关键!
在审核完你的申请材料之后,各种硬件条件都过关的话,有的学校是会有研究生面试的,可能会问到编程知识,如果你答不上来,那大概率是不会被录取的。
数据科学的就业方向
在领英的就业报告中,数据科学被列为最近三年内最具前景的职业之一。主要的就业方向是在政府数据中心、金融机构、互联网企业等单位从事大数据分析师、大数据应用开发工程师等工作。
1、Data Scientist 数据科学家
以高级建模为主,需要较深的领域知识,也包含算法到产品的转化;
2、Data Engineer 数据(库)工程师
以开发、管理和维护数据库为主,也包括优化数据获取流程,搭建数据库环境等工作;
3、Machine Learning Engineer 机器学习工程师
以开发机器学习系统并解决实际产品问题为主,对编程能力有较高要求;
4、Data Analyst 数据分析师
以数据清理/分析为主,为数据驱动的决策服务。需要掌握金融/运筹/经济/市场等知识;