全程强大的数据流和聚合
时间:2022-04-16 14:39:01 | 来源:行业动态
时间:2022-04-16 14:39:01 来源:行业动态
让我们从微软的Power BI公告开始。公告包含了处理从数据来源(Azure IoT Hub和Azure Event Hubs)获得数据流的Power BI数据流功能(云端的功能就是Power Query)。微软的团队承诺称,它将让流数据和实时分析像批处理数据和常规分析一样易于使用不仅仅是针对BI专家和数据工程师,还可以适用于商业用户。而且由于事件中心(Event Hubs)可以在Apache Kafka兼容模式下工作,因此引发了一个问题,即该功能是否有一天可以与该开源流事件平台一起工作。
另一个有趣的功能被称为自动聚合。要了解此功能,你必须了解作为其基础的基本聚合功能。基本聚合功能使你可以在度量的基础上预先计算聚合,从而获得出色的性能,特别是针对那些Power BI已经通过DirectQuery连接了的数据源时,更是如此。DirectQuery可以从后端数据源获取数据。
通过聚合,Power BI可以避免一直到后端获取通用汇总数据,而将这种方式保留给相对较少的详细数据集。聚合的问题在于,用户必须在建模Power BI要查询数据的时候设计聚合。这里有一个好消息,自动聚合功能将根据实际观察到的查询模式自动构建这些算法,随着收集到的此类观察结果数量的增加,它的表现还会变得越来越好。
数据流和自动聚合的预览版本都将在7月发布,这两个功能都是Power BI Premium专有的。由于Premium现在是按用户提供服务,用户需要在Power BI Pro的基础上每个月多支付10美元以使用Premium功能。因此这些功能和更多的用户都相关。同时,另一项Premium功能Power BI部署管道(Power BI deployment pipelines)可以获取面向开发人员的自动化API(Automation APIs)以支持Azure DevOps、GitHub和Azure Pipelines等工具,让它们可以自动化地部署Power BI资产。自动化API(Automation APIs)现在已经可以使用了。
这里有很多只针对Premium用户的功能,而高级用户的定价意味着我们将会看到更多这样的功能。同时,微软还发布了一个很酷的新功能,该功能允许将Power BI报告被内嵌到Jupyter笔记本中作为开源Python包。而且它与Power BI Pro兼容,包括可免费试用的版本。下图是一个装有Power BI的Jupyter笔记本的图片。