构建数据分析闭环
时间:2022-04-01 18:54:01 | 来源:行业动态
时间:2022-04-01 18:54:01 来源:行业动态
数据科学人才的短缺是当下最令企业头疼的问题之一。由于数据科学是集统计学、计算机科学、机器学习和商业于一体的交叉学科,因此,从事数据科学分析工作的人通常也被要求是以上这些能力的综合体,这就为人才的获取和培养筑起了一个高门槛。
根据LinkedIn公司在去年8月发布的美国劳动力报告中提到:具有数据科学技能的人才短缺问题几乎存在于美国的所有大城市。在全美国范围内,共缺少151717名具有数据科学技能的人,其中纽约市(34032人)、旧金山湾区(31798人)和洛杉矶(12251人)的人才短缺尤为严重。而放眼全球市场,这样的人才短缺问题则更为严重。
当然,巧妇难为无米之炊,即便企业拥有最顶级的数据科学家,他们又拥有万花筒般的数据分析方法,如果数据质量无法保证,那么分析得到的结果一点用都没有。对此,企业必须根据业务的情况弄清楚数据的实际意义是什么,梳理出可用数据,剔除无用的垃圾数据和干扰的偏见数据,从输入端扼杀输出结果出错的可能性。
对此,在IBM看来,企业必须从全局出发制定数据战略,通过具有智能功能的分析解决方案,进行规划分析、描述性分析、诊断分析、预测分析和规范分析,帮助企业确定计划是什么、发生了什么、为什么发生以及接下来将发生什么。这才是一个完整的数据分析闭环。
其中,要解决上述的数据质量识别问题,IBM认为首先就要利用相关的技术管理数据的盲点,在数据梳理过程中确定是否缺少数据、是否有数据不正确、是否有任何误导信息等等,唯有如此,才能为数字化转型的高楼打好数据的地基。而在此基础上,企业还必须明确数据与业务成果的相关性和因果关系,了解背后的驱动力,进而找出某一业务场景的关联数据,并以可视化的方式呈现给决策者。
另一方面,针对数据分析,IBM也认为,企业不应该满足于使用基础数据模型,而应该引入机器学习和其它更高级的分析模型组合,通过跨统计分析进行预测建模,才能最大程度挖掘数据价值,形成更完整的洞察,为管理者的全盘决策提供可信的参考。