欢迎来到 星空Online - 织梦者,我的原创世界。
在上一章中,我们一起重温了假设检验的概念,并提出了假设检验的过程 —— 提出原假设,并尝试利用反证法推翻它。
同时也一起回顾了卷积
的概念,并基于其运算规律,推导出了两个服从正态分布的变量相加后的和仍然服从正态分布这一重要结论。
在最后,我们就 A/B Testing 中最常用的检测方法 —— Z 检验做了初步的介绍,并最终得到了对两份样本均值之差计算 Z 值的公式。
在前面,我们一起回顾了中心极限定理,以及正态分布的定义、公式和相关计算。目前来说,想必大家都能够轻松地计算出大样本的边界值、或根据抽样得出的数据反推大样本的数据分布情况。但是回归到 A/B 测试来说,能够分别计算出实验组与对照组的数据范围,就可以得出那一组更好或更差的结论吗?
续上文数据,已知有实验组与对照组数据如下:
| | UV | 订单数 | 人均创单率 | 创单数方差 |
在上一章中,我们一起回顾了什么是分布,概率分布函数及概率密度函数的意义,并在最后给出了正态分布及标准正太分布的数学定义及其相关公式。但并没有涉及到如何利用正态分布进行计算,该篇会从应用的角度,通过几个具体案例与大家一起研究如何计算出我们想要得出的各种数值。
首先我们回顾一下正态分布及标准正态分布的相关的数学定义及相关公式。
假定随机变量 $X$ 服从一个位置参数为 $\mu$、尺度参数为 $\sigma$ 的概率分布,且其概率密度函数为 $ f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}} $,则这个随机变量就称为正态随机变量,正态随机变量服从的分布就称为正态分布,记做 $X\sim{N}(\mu, \sigma^2)$,读作 $X$ 服从 $N(\mu, \sigma^2)$,或 $X$ 服从正态分布。特别的,当 $\mu = 0$、$\sigma = 1$ 时,$f(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}$,我们将这种情况称为标准正态分布,记为 $X\sim{N}(0, 1)$。其概率密度函数可记为 $\phi(x)$。