PercentileApprox
1 概述
PercentileApprox 函数用于计算一组数值的近似百分位数。
百分位数是一种统计指标,用于反映数据在总体分布中的位置,例如 中位数(50% 分位)、90% 分位(P90) 等。
该函数采用近似计算方式,在大规模数据分析场景中能显著提升计算效率。
2 语法说明
3 参数说明
| 参数 | 必需 | 参数类型 | 说明 |
|---|---|---|---|
| 数值内容 | 是 | 字段、表达式 | 需要计算百分位数的一组数值或表达式 |
| 百分位 | 是 | 数值 (0–1) | 百分位位置,范围在 0 到 1 之间,例如 0.5 表示中位数,0.9 表示 90 分位 |
4 示例
4.1 计算订单金额的中位数
在一个订单表中,我们希望了解订单金额的中位数。如果订单金额存储在名为 OrderAmount 的字段中,可以使用如下表达式:
语法示例
数据示例
| 订单ID | OrderAmount |
|---|---|
| 1 | 100 |
| 2 | 200 |
| 3 | 300 |
| 4 | 400 |
| 5 | 500 |
计算结果
4.2 计算销售额的 90 分位值
该结果表示:90% 的销售额低于该值,仅 10% 的销售额高于该值。
5 应用场景
百分位通常用第几百分位来表示,如第五百分位,它表示在所有测量数据中,测量值的累计频次达5%。以身高为例,身高分布的第五百分位表示有5%的人的身高小于此测量值,95%的身高大于此测量值。
常用的百分位数有以下三种:
1.第25百分位数:又称第一个四分位数(First Quartile)、下四分位数,用Q1表示。
2.第50百分位数:又称第二个四分位数(Second Quartile),用Q2表示,即中位数。
3.第75百分位数:又称第三个四分位数(Third Quartile)、上四分位数,用Q3表示。