本文转载自公众号“读芯术”(ID:AI_Discovery)。数据
很多对数据科学领域感兴趣的科学人,最关心的多久问题之一就是:获得数据科学方面的能力需要多长时间?
本文将讨论典型的数据科学能力进程表。获得数据科学能力所需的力晋时间取决于能力的水平,共分为三个层次,数据最后将讨论基于兴趣水平获得数据科学能力所需的科学时间。注意本文提供的多久观点是基于自己的数据科学经验提出的个人观点。
[[356178]]
数据科学的力晋三个层次
在讨论数据科学能力进程表之前,首先介绍数据科学的数据三个层次。本节将讨论笔者认为的科学数据科学能力的三个层次:1级(基础)、2级(中级)和3级(高级)。多久能力从1级增加到3级。这里将使用Python作为默认语言,即使其他编程语言(例如R,SAS和MATLAB)也可用于数据科学。
基础水平
在第一级,你应该学会使用通常以逗号分隔符(CSV)文件格式表示的数据集,应该具备掌握数据基础知识的能力,如数据可视化和线性回归。
1. 数据基础知识
能够操作、清理、结构化、缩放和设计数据。熟练使用pandas和NumPy库,具备以下能力:
2. 数据可视化
能够理解好的数据可视化的基本组成部分。能够使用数据可视化工具,包括Python的matplotlib和seaborn包和R的ggplot2包。应该了解好的数据可视化的基本组成部分:
3. 监督学习(预测连续目标变量)
熟悉线性回归和其他高级回归方法。能够使用scikit-learn和caret等数据包进行线性回归模型构建。具有以下能力:
中级水平
除了基础级别的技能和能力外,还应具备以下能力:
1. 监督学习(预测连续目标变量)
熟悉二值分类算法,例如:
2. 模型评估和超参数调整
3. 结合不同模型进行集成学习
高级水平
能够处理高级数据集,例如文本、图像、语音和视频。除基本和中级技能外,还应具备以下能力:
数据科学能力进程表
基础水平需要6到12个月,中级水平需要7到18个,高级水平需要18到48个月。
数据科学能力的大致进程表| 图源:Benjamin O. Tayo
需要注意,这些只是近似值。获得一定水平的能力所需的时间长短取决于学科背景以及愿意在数据科学研究中投入多少时间。通常,和不具有数据科学相关背景的人相比,具有诸如物理学、数学、科学,工程、会计或计算机科学等分析学科背景的人需要的时间更少。
基础水平可以在6到12个月内达到,中级水平可以在7到18个月内达到,高级水平可以在18到48个月内达到。这完全取决于投入的精力和每个人的背景。总而言之,如果热爱,那就去试试吧!
责任编辑:赵宁宁 来源: 今日头条 数据科学数据可视化线性回归
(责任编辑:综合)
Nikola将于9月开始交付燃料电池卡车 但CEO却已换人 -
荣盛发展大股东质押公司7599万股股份 占公司总股本比例的1.75%
雷柏ralemo Pre 5如何俘获芳心?靠的就是这份清甜 -
北京汽车(01958.HK)年度净利跌59.4% 每股收益为人民币0.24元