18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 行业动态 > 建立数据目录的技术准备

建立数据目录的技术准备

时间:2022-03-08 04:45:01 | 来源:行业动态

时间:2022-03-08 04:45:01 来源:行业动态

建立数据目录,我们要了解企业内部都有哪些数据?这些数据在哪里?数据质量状况是如何的?这些都可以使用Watson Knowledge Catalog的数据自动发现功能去实现。Watson Knowledge Catalog 会自动地发现数据,自动地连接数据源,并导入元数据。它还可以自动地分析数据的质量状况,进行数据质量的打分,并形成数据质量的图表或仪表盘。数据质量的打分,可以利用已经定义的数据质量规则,也可以允许业务人员用拼图的方式,自定义数据质量规则。这种定义方式有点像拼图游戏,数据科学家可以用一些简单的规则如大于、小于、等于、AND、OR、包含、不包含等,自己拼出数据质量规则, 并运行,几分钟就可以得到数据质量的报告。过去,数据科学家拿到一批数据,为了要了解其数据质量,往往要把需求提给IT部门,IT部门还要请软件开发商来写程序,从而分析这批数据的数据质量。从数据科学家提出需求,到拿到数据质量报告,有的时候要几周时间。这与我们目前的高效快节奏的社会完全不匹配。而如果数据科学家用拼图方式,化5分钟定义数据质量规则,然后执行它,15分钟后,就能得到结果了。这种自助式的数据质量探索能力,往往是数据科学家最希望的。



图4

另外,元数据管理和血缘分析,也是数据目录不可或缺的功能,他可以帮助数据科学家了解每一个数据从哪里来,到哪里去,从而更好地理解业务。

关键词:技术,数据,目录

74
73
25
news

版权所有© 亿企邦 1997-2022 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭