当前位置:首页 >娱乐 >没有数据的数据科学?请尽早聘用数据工程师 这可不是学请件个例

没有数据的数据科学?请尽早聘用数据工程师 这可不是学请件个例

2024-06-30 20:20:10 [百科] 来源:避面尹邢网

没有数据的数据数据师数据科学?请尽早聘用数据工程师

作者:读芯术 大数据 离开了数据,数据科学家的据科尽早存在毫无意义。这可不是学请件个例。本文将讨论一些胸怀大志的聘用数据科学家们(以及他们将来的雇主)真正需要了解的事情。

本文转载自公众号“读芯术”(ID:AI_Discovery)。工程

“这一刻你正在应对什么挑战?数据数据师”这位前研究学者回应道:“嗯,我好像应聘成为首席数据科学家了,据科尽早在一个没有数据的学请公司里。”

没有数据的数据科学?请尽早聘用数据工程师 这可不是学请件个例

这件事让人啼笑皆非。聘用离开了数据,工程数据科学家的数据数据师存在毫无意义。这可不是据科尽早件个例。本文将讨论一些胸怀大志的学请数据科学家们(以及他们将来的雇主)真正需要了解的事情。

没有数据的数据科学?请尽早聘用数据工程师 这可不是学请件个例

[[357800]]

没有数据的数据科学?请尽早聘用数据工程师 这可不是学请件个例

什么是聘用数据工程?

如果数据科学是让数据变得有用的一门学科,那么可以想像数据工程是工程将数据变得能用的一门学问。数据工程师们是提供幕后基础设施支持的英雄们,这些基础设施让机器能够记录工作,让海量的数据与数据科学工具包兼容储存。

[[357801]]

图源:LinkedIn

与数据科学家不同,数据工程师们更倾向于不花费那么多的时间研究数据。与此相反,他们研究并处理那些承载数据的基础设施。数据科学家是数据的管理者,而数据工程师们是对数据管道进行管理的人。

没有数据的数据科学?请尽早聘用数据工程师

图源:hackernoon

数据工程有三种主要工作方式:

  • 使数据大规模地储存(数据库)和传输(数据管道)。
  • 维护那些支持企业运作的数据流。
  • 为数据科学提供数据集。

如果没有数据,你无法研究数据科学。如果你被一个没有数据和数据工程的机构聘用为数据科学总监,猜猜谁将会成为一名数据工程师?

数据工程的艰难之处在哪?

食品进购是件简单的事,如果你只是煮你一个人的晚餐还好说,但规模扩大会将这件琐事变得复杂无比——你该如何获得,存储和处理20吨的冰淇淋,且让它一点都没有融化?

相似地,“数据工程”在你为学校项目下载一个小的电子数据表时是相当容易的,但当你在处理千万亿字节规模的文件时就会让人头晕眼花。规模使其本身成为一个复杂的工程学科。

[[357802]]

图源:pixabay

不幸的是,了解这两个学科其中之一并不代表着你就对另一个的知识有所了解。

如果你有了跑去学习两个学科的冲动,你可能成为了那个(令人倍有压力且适得其反的)信念的受害者——数据专家们必须对数据的所有事项都有所了解。数据宇宙正在飞速地扩展着,现在是时候让人们意识到这个领域有多么广阔了,在数据领域的某个领域工作并不自动要求人们去成为全知全能的专家。

讲这么多就是为了说明,这门学科包含了太多的知识,以至于最有决心的天才也无法全部理解和掌握。与其希望数据工程师们全知全能,不如问问彼此(也问问自己),“你是哪一类人?”让我们齐心协力一起工作,而不是在这条路上孤军奋斗。

但这不是一个绝佳的学习机会吗?可能是。这取决于你对已知的学问有多大的感情。数据工程不同于数据科学,所以如果你是个未经受过数据工程训练的数据科学家,那么你得从零开始。

这可能正是你所寻求的乐趣——只要你带着开放的眼光一路前行。建立你的数据工程团队可能要花费好几年的时间。当然,有理由去学习新事物是件好事,但相同的是,你的数据科学“肌肉”可能会因此萎缩。

作为一个类比,想象你是一位能流利使用英日两语的译者。你被提供了一个叫做“译者”的职位。当你来到岗位工作时,你发现你被聘来进行将普通话译为斯瓦希里语的工作,而这两种语言你都不会说。抓住机会成为一个四语达人可能是一件振奋人心且有益的事情,但请从现实的角度来思考你该如何有效地利用初级培训。

换句话来说,如果一个公司没有任何的数据或者数据工程师,那么接受首席数据科学家的工作会在你组建数据工程团队时,为了成为一个数据工程师(你很可能还未达标),将你的数据科学家生涯搁置好几年的时间。

最终,你会很骄傲地看着你所建的团队,然后意识到你不再需要亲自去处理那些细枝末节。那时你的团队已经能够成熟应对那些绝妙的神经网络或者你读博时研究的复杂巧妙的贝叶斯定理推论,你就只能袖手旁观,看着他人完成目标。

[[357803]]

给你一些小建议

(1) 弄清你正在接手的事物

如果你在考虑接受一个成为数据科学总管的工作,你第一个应该提出的问题是:“谁来保证我的团队有数据能研究?”如果答案是你,嗯,至少你将知道自己的签约将意味着什么。

(2) 请记住你是顾客

既然数据科学受数据支配,只有数据工程师们作为同事可能并不够。如果那些同事们没能将你认定为他们工作的一个关键客户,你将面对的是一个艰难的斗争。如果他们的态度让你更多的感受到自己是一个博物馆策展人,为了数据而保存数据,那这可不是一个好兆头。

(3) 要有全局观

诚然你是数据工程师们的关键客户,但很可能你并不是他们的唯一客户。现代企业使用数据推动业务发展,通常情况下,无需人为干预,数据就能很好地运转。当你对公司的贡献只是“可有可无”时,表现得好像世界都是围绕着你和你的团队转的,这是不明智的。

(4) 坚持问责

在登记你新的十亿字节之前,考虑与数据工程同事协商,让他们对与你的合作负责。如果他们没有将你拒之门外的反应,你的团队就不太可能蓬勃发展。

 

责任编辑:赵宁宁 来源: 读芯术 数据科学数据大数据

(责任编辑:探索)

    推荐文章
    • 股指期货是什么意思?股指期货合约的最后交易日是什么时候?

      股指期货是什么意思?股指期货合约的最后交易日是什么时候?股指期货是什么意思?股票指数期货是指以股票价格指数作为标的物的金融期货合约,在具体交易时,股票指数期货合约的价值是用指数的点数乘以事先规定的单位金额来加以计算的。股指期货可以进行双向操作,存在保证金制 ...[详细]
    • 自我生长的细胞可降低人造肉成本

      自我生长的细胞可降低人造肉成本这种细胞可自制生长物质,无须昂贵的培养基。 研究人员设计出了一种奶牛的肌肉细胞,这种工程化细胞无须昂贵和高能耗的生长因子就能繁殖。研究人员乐观地认为,如果规模扩大,可以降低实验室培育肉类的生产成本。但 ...[详细]
    • 受贿4087万,套取公款783万!南航深圳分公司原总经理刘国军一审获刑14年

      受贿4087万,套取公款783万!南航深圳分公司原总经理刘国军一审获刑14年1月30日,贵州黔东南州中级人民法院一审公开宣判中国南方航空股份有限公司深圳分公司原党委副书记、总经理刘国军受贿、贪污一案,对刘国军以受贿罪判处有期徒刑12年,并处罚金100万元,以贪污罪判处有期徒刑 ...[详细]
    • 蚕桑互作新机制揭示

      蚕桑互作新机制揭示【研究进展】    科技日报讯 记者雍黎)家蚕的生长发育与桑叶有关。1月29日,记者从西南大学获悉,该校何宁佳教授团队日前首次证明了桑树源微小核糖核酸miR168a可跨界调控家蚕生长发育,揭示了蚕桑互 ...[详细]
    • 分期乐提额没有公积金怎么办 具体方法有哪些?

      分期乐提额没有公积金怎么办 具体方法有哪些?分期乐是采用先授信再借钱模式,借款人出了额度才能借钱,如果对额度不满意还可以向分期乐申请提额,像有公积金的可以认证公积金提额。不过并不是每个人都有交公积金,那么分期乐提额没有公积金怎么办?这里就给大家 ...[详细]
    • 节前又现弃奖!

      节前又现弃奖!河北607万元大奖过期,奖金滚入公益金新快报讯 记者陆妍思 通讯员冀彩报道 1月25日,是河北省沧州市双色球607万元大奖兑奖期限的最后一天,由于大奖得主仍未现身,607万元大奖最终成为弃奖,奖金自动 ...[详细]
    • 三大运营商各有亮点 中国广电基本达标

      三大运营商各有亮点 中国广电基本达标2023年通信业“成绩单”公布工业和信息化部日前发布《2023年通信业统计公报》,公报数据显示,2023年电信业务量收双增,全年电信业务总量同比增长16.8%,比全国服务业生产指数增速快8.7个百分点 ...[详细]
    • 国内大模型与GPT

      国内大模型与GPT1月30日,上海人工智能实验室发布了大模型开源开放评测体系司南OpenCompass2.0),同时在对部分主流大模型评测诊断的基础上,揭晓了年度大模型评测榜单,提到了国内大模型的优势与短板。根据评测, ...[详细]
    • 花呗为什么提前还款是大忌 具体原因有哪些?

      花呗为什么提前还款是大忌 具体原因有哪些?很多人会使用花呗提前消费,无法一次性还款就会办理花呗分期,等手里头有钱了就打算提前还款。虽说花呗分期是支持提前还款,可有不少人认为花呗提前还款是大忌。那么,花呗为什么提前还款是大忌?这里就来给大家分析 ...[详细]
    • “十四冬”的观天人

      “十四冬”的观天人【新春走基层·身边暖镜头】◎本报记者 付丽丽    1月28日早上5时,内蒙古呼伦贝尔扎兰屯,呼伦贝尔市气象台副台长王颖的闹钟准时响起。她习惯性地看了一眼室外温度显示,-16℃。    当天,第十四届 ...[详细]
    热点阅读