因此,您的数据将不再具有正态分布
Posted: Mon Jan 06, 2025 10:29 am
而是泊松分布(对于那些想知道差异的人,我建议您参考中心极限定理,您可以从中证明泊松分布在足够小的间隔内变为高斯分布)。但在这种情况下,事情非常简单 - 标准偏差实际上是您的时间段内预期发生次数 λ 的平方根。因此,如果您的数据为您提供了过去六个月的预期每周转化次数为λ=900,并且您根据模型预测下周应该获得 805 次转化,那么您可以向您的 HiPP 显示每日转化次数 850±30 这个数字。 这些有什么用呢? 正如我在文章开头提到的,标准差最有用的一点是能够表明你对数据的信心程度。
对于正态分布的情况,一个标准差包含 68.2% 的数据点,如这张可爱的图表所示。 具有一个、两个和三个标准偏差标记的高斯分布 两个(更准确地说是 1.96 个)标准差会为您提供 95% 的置信区间,并且您 乌干达电话数据 可以 99% 地确信某个点会落在三个标准差之内。 将此应用于 SEO,想象一下您遇到这样的情况:客户想知道他的电子邮件简报是否产生了效果。您可以回顾数据,无论多长时间对您有意义,然后找到平均值和标准差。如果您在简报发布时看到直接访问和推荐访问量达到峰值,则可以计算出那些天的访客平均数(当然,如果您没有看到峰值,您已经知道答案了 - 恐怕要重新开始)。
通过查看此值与平均值之间的标准差,您可以准确地告诉客户您对该活动增加访客数量的信心有多大。他们会更认真地对待您说“电子邮件活动产生明显效果的日子的平均值与不包括这些日子的其余时间段的平均值相差 1.2 个标准差,因此我们的数据显示,我们只能 40% 确信您的电子邮件活动增加了流量”,而不是说“是的,看起来效果可能不太好”。 然而,有一个警告。 如果你使用的样本量较小,则应使用标准误差,因为这会进行一些修正。标准误差由以下公式给出: 标准误差方程 所以: 如果你只有一周的数据(例如,比较复活节假期后和假期期间教育网站的表现),你应该使用标准错误 如果您有几周的数据,您只需使用 Excel 中的 STDEV() 函数即可。
对于正态分布的情况,一个标准差包含 68.2% 的数据点,如这张可爱的图表所示。 具有一个、两个和三个标准偏差标记的高斯分布 两个(更准确地说是 1.96 个)标准差会为您提供 95% 的置信区间,并且您 乌干达电话数据 可以 99% 地确信某个点会落在三个标准差之内。 将此应用于 SEO,想象一下您遇到这样的情况:客户想知道他的电子邮件简报是否产生了效果。您可以回顾数据,无论多长时间对您有意义,然后找到平均值和标准差。如果您在简报发布时看到直接访问和推荐访问量达到峰值,则可以计算出那些天的访客平均数(当然,如果您没有看到峰值,您已经知道答案了 - 恐怕要重新开始)。
通过查看此值与平均值之间的标准差,您可以准确地告诉客户您对该活动增加访客数量的信心有多大。他们会更认真地对待您说“电子邮件活动产生明显效果的日子的平均值与不包括这些日子的其余时间段的平均值相差 1.2 个标准差,因此我们的数据显示,我们只能 40% 确信您的电子邮件活动增加了流量”,而不是说“是的,看起来效果可能不太好”。 然而,有一个警告。 如果你使用的样本量较小,则应使用标准误差,因为这会进行一些修正。标准误差由以下公式给出: 标准误差方程 所以: 如果你只有一周的数据(例如,比较复活节假期后和假期期间教育网站的表现),你应该使用标准错误 如果您有几周的数据,您只需使用 Excel 中的 STDEV() 函数即可。