标准差sigma怎么算超简单！

头条创作挑战赛之AB Test篇

一、AB Test的定义与使用方法

AB Test定义

AB Test本质上是一种标准的独立双样本检验，基于大量用户的行为数据上的统计指标，对原假设进行判断。通过创建两个版本——实验组和对照组，来对比不同策略或产品的效果。

AB Test优点

通过小量抽样流量评估对整体的影响。

有数据支撑新的决策，降低新策略或功能的成本。

加快想法验证的速度。

AB Test的核心价值

帮助业务定量增长，实现数据驱动精细化运营。

分析数据定性因果，验证因果关系确保迭代方向。

AB Test的使用规则

1. 流量分配：为保证结果的可信度，实验组和对照组的流量需对等。可以使用流量组、对照组和空白组的方式进行分配。

2. 分组原理：实验时间要合理，若涉及用户交互习惯的改动，建议以月为单位；若涉及逻辑策略改动，则以周为单位。

3. 情况分类：AB Testing主要针对产品当前状态的优化，不应用于从0到1的创造过程。若业务基础能力搭建、业务战略需求等无需进行AB测试。

4. 流量分流策略：良好的分层、分流规则可以充分使用网站的流量。常见的分流策略有Random（随机分流）、Partition By User（按用户切分）和Partition By Category（按分类）。

二、关于AB Test的关键知识点

业务类指标

在AB Test中，业务类指标与业务搭建的数据指标体系紧密相关。在设计AB Test时，需要规定北极星指标（一个重要的数据指标或一组数据指标）。可分为均值类指标（如平均在线时长、平均GMV）、比率类指标（如点击率、转化率）和聚合类指标（如活跃用户数、曝光数、点击数）。

统计理论

涉及概率抽样、全概率公式、大数定律和中心极限定理等。这些理论为AB Test提供了基础。

概率抽样：涉及简单随机抽样、分层抽样等。

全概率公式：用于估算一个策略针对不同人群产生的不同效果对整体的影响。

大数定律和中心极限定理：是实验能成立的理论基础，也是实验需要一定样本量和周期的理论依据。

三、用户分层原则与统计知识应用

用户分层原则

正交分层：同一份流量可以经过多个实验层，每个实验层的流量要遵循离散随机。

互斥原则：不同的实验层，逻辑要互斥。

统计知识在AB Test中的应用

涉及分布类型（如正态分布、二项分布等）、概率抽样、假设检验（显著性：单变量、双变量、多变量）等。这些知识和工具的应用使得AB Test更加科学和精准。

四、总结与拓展知识点

AB Test的重要知识点总结

业务类型指标与统计理论是AB Test的两大核心。

正确的使用方法和用户分层原则是保证AB Test效果的关键。

拓展知识点

置信区间与置信度的概念及应用：用于估计总体参数的一个区间范围，常用的置信水平为95%。

显著性在假设检验中的应用：通常将阈值小于5%的事件视为“不可能事件”，即需要拒绝原假设。

Z分布及其他分布的应用：在抽样调查和统计分析中的重要工具。

参考资料

《阿里妈妈数据科学：离线抽样 AB Test篇》

《腾讯数据科学：AB实验驱动理性增长》应用回归分析等。