跳转至

产品基本概念

概述

AloudataCAN 中有以下基本概念,快速了解基本概念和名词可以更好的使用指标平台。

image.png

数据源

数据源模块是指标平台的数据底座。指标平台内置 Starrocks 或 Doris 数据库作为指标的计算和加速引擎,用户可以将外部的数据库通过外表模式也接入到指标平台中。

概念 说明
内表 数据导入到 Starrocks 或 Doris 自身的存储数据库中。
外表 数据通过 Starrocks 或 Doris 的外表连接功能接入到引擎。

数据集

image.png

通过数据源数据可以创建数据集。数据集可以通过直接选择指定的数据源表或者自定义 SQL 的方式创建。

数据集关系

指标平台的数据集通过关联关系,可以形成数据模型,数据模型是指标平台中指标和维度关联的重要基础。

image

概念 说明
关系 两个数据集之间通过关联关系进行数据的连通。 * 关联字段:两个数据集之间通过对应的关联字段进行关联 * 基数:指两个数据集中关联字段之间的数量级关系。字段A N:1 字段B,表示两份数据集中,每个字段 B 都可以找到多个字段 A 与其值相等。 !!! warning 重要
**案例:订单表/产品 ID  N:1 商品表/产品 ID** 表示商品表中每个产品 ID 都可以在订单表中找到多条该产品ID的数据记录。 *   **方向**:方向指两份数据集之间的数据流通方向,由关联关系中的 1端数据集流向 N端数据集。       |

维度

image.png

维度是由数据集中的字段绑定生成的实体,在指标平台中,维度的类型有两种,分别为直接通过字段映射以及通过自定义表达式创建的维度。

指标

image.png

用户基于数据集定义出的业务指标。指标平台中支持定义三种类型的指标,用于满足不同层次和不同复杂度的指标需求。

概念 说明
基础指标 基础指标基于数据集的字段进行聚合。
派生指标 基于基础指标添加时间限定、业务限定以及衍生方式生成派生指标。 * 时间限定:为指标计算设置时间范围,比如近7日、本月至今 * 业务限定:为指标计算添加维度筛选条件,比如下单渠道=“线上” * 衍生方式:为指标设置同环比、占比、排名的衍生方法
复合指标 基于基础指标或派生指标,结合四则运算以及函数,将多个指标的计算结果拼接在一起

image.png

指标视图

指标视图是基于前面定义的指标、维度、筛选器而生成的一张二维表。该二维表有两个用途,一是用于在指标平台进行数据探查,获取指标计算结果;二是通过该二维表与其他BI分析软件进行对接,如 Tableau、观远等。该指标视图是在语义层的一张虚拟表,不会实际在数据源中创建,每个指标视图保存在语义层创建的Catalog、Schema中,可通过JDBC来进行访问。

物化加速

AloudataCAN 可以根据诉求将数据提前计算生成物化视图,在查询指标时会根据数据的更新情况自动选择合适的物化数据改写查询 SQL,从而实现数据加速。

概念 说明
字段明细加速 选择多个数据集的字段,将多个字段提前合并为一张宽表,查询时使用该宽表数据进行加速。
指标维度加速 选择指标和维度组合,提前计算出该维度下的指标结果,查询时若查询该指标,则使用该预聚合的数据进行加速。