跳过导航
跳过mega-menu
两个人在屏幕前合作,显示代码和数据.

采访了z hlke的几位数据科学家, 其中一个共同的主题是,他们发现很难为他们所做的事情想出一个单一的定义. “这是一个相当探索性的角色,”西蒙·德布斯基说. “当我们坐下来解决问题时, 我们不知道答案是什么, 所以作为数据科学家,我们做了一个假设, 测试, 评估并重复这个循环,直到我们解决了它. 这很有趣.”

想知道这在实践中是什么样子? 在本文中,我们采访了西蒙, 来自z hlke团队的Daphne和Andriy来了解更多——以及为什么数据科学远远超出了机器学习和人工智能.


Szymon Debski, z<s:1> hlke的高级数据科学家. 达芙妮·迈克尔森·萨利斯. Andriy Rekalo, z<s:1> hlke首席数据顾问

西蒙·德布斯基,达芙妮·迈克尔森,萨利斯·安德烈·雷卡洛

高级数据科学家首席数据顾问


数据科学家是做什么的?

数据科学是一个广泛的领域,本质上是指从数据中提取意义的过程. 数据科学家认为, 杂乱的信息,并利用不同的模型和算法来提供有用的见解. 但实际上,这只涵盖了它们的部分作用. 很多时候,他们没有得到一个明确的概要,所以他们需要定义自己的. 安德里·雷卡洛说, z hlke的数据科学家之一, “我们需要回答的最重要的问题不是‘如何’,而是‘是什么’——我们首先应该解决什么问题。, 数据中的价值是什么,我如何解锁它?”

人们对数据科学家的角色有哪些误解?

首先,很多人会把数据科学和数据工程搞混. 它们是不同但互补的角色. 数据工程师负责以可用的方式收集和构建数据, 而数据科学家则进行分析, 对这些数据进行实验和测试,以便对其进行解释. 数据科学家设计的模型是否应该被生产, 它被反馈给数据工程师,让他们继续前进. 两者紧密合作,但各自处理项目过程的特定部分.

这三位z hlke数据科学家也同意的一件事是,公众并不真正了解这项工作的要求. “例如,人们经常听说流行语工具,并来找你要求使用它们, 他们认为数据科学家大部分时间都在做建模,西蒙说。.

安德里也有同感. “它被描绘成21世纪最时髦的工作之一, 但在现实中是非常不同的,他解释道. 当被问及他为什么这么说时, 他指出,在你得到“酷”的东西之前,你必须付出所有的努力. “你的大部分时间都花在试图理解数据中的问题,然后为分析和建模做准备, 只有这样你才能用它做事,他说. 话虽如此, Andriy还强调了这个角色的回报性质——即你在数据科学领域的工作所产生的影响. “当你看到一个模型被部署时,你可以计算出它带来的有形价值——你可以量化它,给它一个数字,他说.

如何成为一名数据科学家?

鉴于这个名字,这并不奇怪, 但数据科学家确实花了很多时间处理数据, 所以这有助于理解它是如何工作的. “我想说,你应该从打好统计学基础开始, 让你的头脑明白如何处理数据也很有帮助——尤其是当数据很多的时候,达芙妮·萨利斯说.  一旦你掌握了这一点,你还需要添加一些技术技能. “你将处理数据,完成数据清理等任务, 数据可视化和数据分析, 所以你必须熟悉编码——Python或R的知识在这里很有用,西蒙说。.

所有的团队成员都建议获得一些实践经验,以确保这是一个真正适合你的职业. 西蒙建议在像Kaggle这样的网站上报名参加项目和比赛, 然后在接近潜在雇主之前把作品集整理好. 这也允许您按照Andriy的指导找到您真正喜欢的数据科学方面并进一步发展. “我的建议是,不要把注意力集中在目前最流行的技术上,找到你真正感兴趣的东西,他说.

为什么要成为数据科学家?

所有三个团队成员都从他们的角色中获得了不同的东西, 他们都对自己的工作充满激情. Andriy说,数据科学的“科学”部分真正吸引了他. “你在做实验,并不总是知道你会在哪里结束. 与传统的软件开发相比,它的确定性要小得多——但这正是它有趣的地方,他解释道. 对达芙妮来说,这是科学的部分,加上她所欣赏的角色的动态特性. “我喜欢在数据中看到新的信号——用不同的理论和实验来找出事情发生的原因是令人兴奋的,她说。.

在z hlke谈论数据科学时,一个关键的方面是围绕它的实践社区. 组织内的数据科学家, 以及对这个课题感兴趣的同事, 他们通过正式和非正式渠道相互支持. 西蒙说:“归根结底,这一切都是为了提高z hlke的数据科学能力。. 他提到了一些举措,比如建立过去项目的文档库存,以帮助销售和交付, 共同设计新的标准数据产品, 为非营利组织做慈善活动, 举几个例子.

一个反复出现的共同主题是,当每个团队成员的辛勤工作得到回报时,他们都会感到满足, 他们看到了自己的努力在现实世界中的价值. 这可以像帮助开发背后的模型一样大规模 NHS Covid-19检测和追踪应用程序, 或者像保险应用程序上的自动索赔评估这样日常的东西,让人们的生活变得更容易. 此外,正如西蒙所说,“即使是现在,每次你得到结果时,仍然感觉有点神奇.”

在短暂的...

  • 数据科学家与团队合作,找出需要使用数据回答的问题, 以及如何最好地去做.
  • 这一切都始于坚实的统计和数学基础, 以及一些处理实际数据和运行实验的技术技能.
  • 数据科学不是十大网博靠谱平台任何一种技术或方法, 而是找到正确的方法来理解给定项目的数据.


想了解更多? 请访问我们的数据科学页面在这里浏览开放的角色.

澳门十大正规赌博娱乐平台

在这里注册