标准偏差σ的计算公式

标准偏差σ的计算公式

头条创作挑战赛之AB Test篇

一、AB Test的定义与使用方法

AB Test定义

AB Test本质上是一种标准的独立双样本检验,基于大量用户的行为数据上的统计指标,对原假设进行判断。通过创建两个版本——实验组和对照组,来对比不同策略或产品的效果。

AB Test优点

通过小量抽样流量评估对整体的影响。

有数据支撑新的决策,降低新策略或功能的成本。

加快想法验证的速度。

AB Test的核心价值

帮助业务定量增长,实现数据驱动精细化运营。

分析数据定性因果,验证因果关系确保迭代方向。

AB Test的使用规则

1. 流量分配:为保证结果的可信度,实验组和对照组的流量需对等。可以使用流量组、对照组和空白组的方式进行分配。

2. 分组原理:实验时间要合理,若涉及用户交互习惯的改动,建议以月为单位;若涉及逻辑策略改动,则以周为单位。

3. 情况分类:AB Testing主要针对产品当前状态的优化,不应用于从0到1的创造过程。若业务基础能力搭建、业务战略需求等无需进行AB测试。

4. 流量分流策略:良好的分层、分流规则可以充分使用网站的流量。常见的分流策略有Random(随机分流)、Partition By User(按用户切分)和Partition By Category(按分类)。

二、关于AB Test的关键知识点

业务类指标

在AB Test中,业务类指标与业务搭建的数据指标体系紧密相关。在设计AB Test时,需要规定北极星指标(一个重要的数据指标或一组数据指标)。可分为均值类指标(如平均在线时长、平均GMV)、比率类指标(如点击率、转化率)和聚合类指标(如活跃用户数、曝光数、点击数)。

统计理论

涉及概率抽样、全概率公式、大数定律和中心极限定理等。这些理论为AB Test提供了基础。

概率抽样:涉及简单随机抽样、分层抽样等。

全概率公式:用于估算一个策略针对不同人群产生的不同效果对整体的影响。

大数定律和中心极限定理:是实验能成立的理论基础,也是实验需要一定样本量和周期的理论依据。

三、用户分层原则与统计知识应用

用户分层原则

正交分层:同一份流量可以经过多个实验层,每个实验层的流量要遵循离散随机。

互斥原则:不同的实验层,逻辑要互斥。

统计知识在AB Test中的应用

涉及分布类型(如正态分布、二项分布等)、概率抽样、假设检验(显著性:单变量、双变量、多变量)等。这些知识和工具的应用使得AB Test更加科学和精准。

四、总结与拓展知识点

AB Test的重要知识点总结

业务类型指标与统计理论是AB Test的两大核心。

正确的使用方法和用户分层原则是保证AB Test效果的关键。

拓展知识点

置信区间与置信度的概念及应用:用于估计总体参数的一个区间范围,常用的置信水平为95%。

显著性在假设检验中的应用:通常将阈值小于5%的事件视为“不可能事件”,即需要拒绝原假设。

Z分布及其他分布的应用:在抽样调查和统计分析中的重要工具。

参考资料

《阿里妈妈数据科学:离线抽样 AB Test篇》

《腾讯数据科学:AB实验驱动理性增长》应用回归分析等。


标准偏差σ的计算公式