Web爬数
Web.Page(Web.Contents("URL")){}[Data]
思维过程:
确定要获取信息所在网站
解析网址
明确应使用什么函数爬数
明确所要数据在网址全部数据中的什么位置
创建参数表或自定义函数,批量或灵活爬取所要信息
Power Pivot
多维数据模型
多维数据模型又叫多维数据集、立方体,指的是相互间通过某种联系被关联在一起的不同类别的数据集合。
多维数据模型:在咨询公司以及 BI工具厂商的介绍性资料中又被 称为“立方体(Cube)”,在这 些资料中常以一个立体正方形的 形式出现。多维数据集可以从多 角度用数据全面映射某种业务的 实际状况。
搭建方法:
明确表与表之间用于匹配的关键字段
在关系图视图模式下选中某个表的关键字段拖拽向另一个表的关键字段
注意事项:
用于连接两表的两个关键字段中,至少有一个关键字段是没有重复值的
关键字段中有重复值的表为主表,没有重复值的表为附表,在数据透视表中,只有当行列 标签来自附表时,附表才能提供值字段
两表关联时必然有一个主表和一个附表(如果两个关键字段都没有重复值,连接时先选中 的表为主表)
交叉筛选器方向
单一/两个
双向交叉筛选:连接的两个表可以互相筛选,适用于星型架构,不适用于 交叉模式
单向交叉筛选: 维度表可以筛选度量表,绝大多数情况用单向交叉筛选
连接逻辑梳理
一对一:主键对主键(最不可能出现)
一对多:主键对非主键(最正确的连接方法),一表出维度,多表出度量
多对多:非主键对非主键(可能出现,但是不能用)
类型一与类型二的汇总说明
类型一:维度对度量进行合并同类项的计算。维度 --> 度量
类型二:维度下对应的连接用关键字段不同情况对度量进行汇总的结果。维度-->对应关键字段 --> 度量
双向连接可以跨表取字段
一对一的关系下使用建议使用默认双向连接,不管哪方出维度都可以正确汇总值字段
交叉模式下只能创建一侧的有效连接
跨表取字段是类型2的汇总方式
维度和关键字段满足父子级关系时,类型二和类型一得到相同结果
父子级关系:
一个父级值下对应多个不同的子级值
一个子级值只能属于一个父级值
暂无数据