数据科学的当前定位
时间:2022-04-01 17:54:01 | 来源:行业动态
时间:2022-04-01 17:54:01 来源:行业动态
在Dun Bradstreet公司,Scriffgnano主要负责技术创新与开发工作,同时也管理着世界上规模最大的同类商业数据库项目。Scriffignano解释道,这套前所未有的数据库持续从全球各个国家(除朝鲜与古巴之外)收集大量数据,日均摄取达数百万次。
这套数据库融合了每一种语言与写入系统,而且由七套不同的集成化数据库共同组成。这一综合性数据系统在跟踪企业数据的同时,亦会对总体风险及发展机遇做出全球性观察分析。以此为基础,该数据库得以实现大规模数据分析,进而检测供应链异常以及客户购买行为中发生的变化。毫无疑问,要从如此庞大的信息库当中提取价值,数据科学将成为我们不可或缺的关键武器。
对于像Dun Bradstreet这样的组织来说,最大的挑战之一在于如何寻找经验丰富的数据科学家,保证这些既拥有从业背景、又颇具实践经验的人才处理如此巨大的研究数据集。遗憾的是,目前的人才市场还无法满足他们对于数据科学技能的需求。
Scriffignano表示,他相信AI技术正在快速发展,并必将在未来逐渐取代熟练的数据科学家,进而实现技术本身的普遍化与大众化。在Scriffignano看来,成为一名成熟数据科学家所需要的技能,在范围与深度方面都要远远超过机器学习模型开发者。从本质上讲,真正的数据科学家需要专注于立足更广泛的问题从数据中提取价值;相比之下,目前很多自称数据科学家的从业者实际上更像是机器学习工程师,也更多关注机器学习模型开发方面的工作。
Scriffignano认为,我们需要更多关注数据科学家概念中的科学家部分。在他看来,数据科学家必须有能力从观察到的数据中提出新的问题或者理论,对这一理论进行实验设计与具体测试,而后得出结论并分享相关结果。Scriffignano注意到,大多数组织只要求数据科学家给出可重复使用的模型,他强调只有将数据科学家视为改进与创新工作中的关键,才能帮助组织迈向成功。他还指出,正是由于不愿放权让数据科学家们接触单纯模型开发之外的新领域,才导致众多组织长期无法真正在数据科学与AI技术领域取得进展。