微信客服
wholerenguru3 (厚仁学术哥)
什么是数据科学?什么是数据科学家?
数据科学是一个跨学科的领域,它使用科学的方法、过程、算法和系统从许多结构化和非结构化数据中提取知识和洞察力。数据科学是一个复杂的领域,它涉及数十种不同的技能。
从本质上说,数据科学家是为了得出结论而进行收集和分析的人。他们通过许多不同的技术来做到这一点。
让我们看一个非常典型的数据科学家的例子。比如一家手机公司,想知道当前的哪些客户更有可能将服务转向他们的竞争对手。他们可能会雇佣一个数据分析师来研究数百万个与前客户相关的不同数据点。他们可能会发现,使用一定带宽的客户更有可能离开,或者已婚且年龄在35岁至45岁之间的客户最有可能更换运营商。手机公司可以改变他们的商业计划或营销策略,以达到吸引和留住这些客户的目的。
网飞用户每次访问自己的账户时,都会看到一个实际的数据管理例子。这类视频流媒体利用过去浏览历史的信息,通过算法可以为用户推荐其可能喜欢的节目。这在一些其他服务中也可以看到,比如潘多拉(音乐流媒体)的点赞按钮,以及亚马逊的购物推荐。
在这些信息背后进行收集,处理和分析的人就是数据科学家。
大量的需求和优厚的待遇
在今天的高科技世界,每个人都有迫切的问题,必须通过“大数据”来回答。从企业到非营利组织再到政府机构,似乎有无限多的信息可以被分类、解释,并用于分析解决具体的问题。这使得职场中对数据科学家的需求与日俱增。
根据IBM的研究报告,截止2020年,美国所有数据专业的就业岗位将增加36.4万个,至272万个。数据科学家、数据开发人员和数据工程师这些快速增长的新职业的年需求将达到近70万个职位的空缺。数据科学和分析(DSA)工作的平均开放时间为45天,比市场平均开放时间长5天。
source:https://www.ibm.com/downloads/cas/3RL3VXGA
这份报告同时指出,需要机器学习技能的工作平均工资为114,000美元。数据科学家招聘广告的平均薪酬为105,000万美元,数据工程招聘广告的平均薪酬为117,000万美元。另外根据datajobs.com的调查,数据科学家的薪资范围为8,5000 – 170,000美元。
Source: O’Reilly Salary Data Science Salary Report, 2016
几乎各行各业都有数据科学家的用武之地。其中云服务的薪资中位数接近140,000美元,金融,医疗和保险等领域的薪资水平遥遥领先。
数据科学家最需要的技能是什么?
Lianne & Justin 利用自然语言处理(NLP)技术收集了2020年1月25日北美8个城市的2681个数据科学家的招聘信息,分析得出雇主最看中的十大技能和工具。
十大技能:
-
机器学习(Machine Learning)
-
统计数据(Statistics)
-
调研(Research)
-
预测(Prediction)
-
可视化(Visualization)
-
建议(Recommendation)
-
优化(Optimization)
-
深度学习(Deep Learning)
-
自然语言处理(Natural Language Processing)
-
回归模型(Regression)
对于多数工作而言,机器学习是数据科学家的全部工作,64%的招聘信息中提到了机器学习。数据科学家需要学习一些常见的机器学习算法。
统计学知识为数据科学家打下坚实的基础,59%的职位要求它。要成为数据科学家的同学应该学习数据收集、实验设计、概率分布和其他统计概念。
数据可视化也越来越流行。一幅画胜过千言万语,数据科学家需要通过数据可视化展示他们的分析结果。
十大工具:
-
Python
-
SQL
-
R
-
Spark
-
Cloud
-
亚马逊网络服务(AWS)
-
Java
-
Tensorflow
-
Hadoop
-
SAS
编程语言Python无可争议是最受雇主看中的工具,62%的职位要求了解Python知识。其次,数据查询语言SQL也出现在40%的职位招聘中。当雇主拥有大量数据时,如Spark、Cloud、AWS、Tensorflow和Hadoop这类大数据分析工具也很受欢迎。
最后,想和同学们说,虽然数据科学作为一个跨学科的领域要求从业者拥有多种不同的技能储备,而最终的目的是要解决实际的问题。
美国招生协会
AIRC权威认证
80位
美国双语导师
10年+
名校申请经验
8600+
名校名企录取
微信客服
wholerenguru3 (厚仁学术哥)