spreadsheets里的数据,安静地躺在那里,一列一列,整整齐齐。但你盯着它们,它们也盯着你,沉默中透着一股子挑衅。老板走过来,拍拍你的肩膀,说:“小王,看看这批销售数据,分析一下稳定性。”
稳定性?
这词儿一出来,脑子里是不是瞬间闪过一堆高大上的名词?但说白了,他就是想知道,这堆数字是铁打的营盘,稳如老狗,还是像坐过山车,忽高忽低,心脏病都要犯了。
这时候,一个幽灵般的名字就会在你脑海里盘旋——方差。
别怕。我知道,这玩意儿听起来就像是高中数学课上那个让你打瞌睡的催眠符。但相信我,在Excel这个地界儿,搞懂它,你就能从一个只会SUM和AVERAGE的“表弟表妹”,一跃成为能看透数据灵魂的“表哥表姐”。
先别急着敲公式,咱们聊聊方差是TM个啥?
想象一下,你管着两个销售团队。
A团队,上周业绩是:100, 101, 99, 102, 98。 B团队,上周业绩是:50, 150, 20, 180, 100。
你用AVERAGE函数一拉,嘿,两边平均值都是100。你要是就这么拿着平均数去跟老板汇报:“报告老板,两个团队表现一样棒!” 我保证,B团队的负责人能当场给你表演一个原地爆炸。
为啥?因为A团队那叫稳定,大家都在平均线上下扑腾,像一群训练有素的鸽子。而B团队呢?那是一群野马,有的一飞冲天,有的跌入谷底,平均值完全掩盖了这种巨大的、几乎是失控的波动。
方差,就是专门来量化这种“波动程度”或者说“离散程度”的武器。它告诉你,这堆数据,到底是以平均值为中心紧密团结着,还是各自为王,散得像一盘沙。方差越大,数据就越狂野,越不稳定;反之,方差越小,数据就越乖巧,越稳定。你以为你只是在算一个平平无奇的数字,实际上,你是在给这堆数据的‘狂野’程度打分,是在量化它们内部的‘混乱’与‘和谐’。
Excel里的“双胞胎陷阱”:VAR.P vs. VAR.S
好了,理论武装完毕,打开Excel,准备大干一场。你在单元格里自信地敲下=VAR…然后,你就傻眼了。
VAR, VARA, VAR.P, VARPA, VAR.S, VAR.SKEW... 这都什么鬼?感觉像是闯进了某个神秘组织的代号列表。
别慌。这里面,我们日常打交道的,99%的情况下,就是那对长得极像、却暗藏杀机的双胞胎:VAR.P和VAR.S。
坑就坑在这里。用错了,你得出的结论可能谬以千里。
VAR.P:上帝视角,总体的方差
这里的“P”,代表Population,也就是“总体”。
什么时候用它?当你手里拥有全部的、所有的、完整的数据时。一个都不能少。
这是一种“上帝视角”。比如,你们班总共就10个学生,你想算这10个学生期末考试成绩的方差。你已经拿到了所有10个人的分数,不多不少。这时候,你就可以用VAR.P。你是在对一个已经完全展现在你面前的、封闭的世界进行总结。
公式大概是这样:=VAR.P(A2:A11),其中A2到A11是你那10个学生的成绩。
但说实话,在真实的工作场景里,这种机会少得可怜。我们更多时候,是管中窥豹。
VAR.S:侦探的推断,样本的方差
这里的“S”,代表Sample,也就是“样本”。
这才是我们这些凡人在数据分析江湖里最常用的武器。
你不可能问遍全中国14亿人对某个产品的看法,对吧?你只能抽个几千人做个问卷调查。这几千人,就是你的“样本”。你分析这个样本,是为了推断和估计全中国14亿人(总体)的情况。
当你用样本数据去计算方差时,你就必须用VAR.S。
为什么不能用VAR.P呢?因为样本的波动性,通常会比总体的波动性要小一些。你想想,你从一个巨大的、充满各种极端值的池子里捞一小桶水,你很可能捞不到那些最极端的值。所以,如果我们直接用样本的方差去估计总体的方差,结果往往会偏小。
为了修正这个偏差,VAR.S的计算分母用的是“n-1”,而VAR.P用的是“n”(n是数据点的数量)。这个“-1”被称作“贝塞尔校正”,你不需要懂它背后的复杂数学推导,你只需要记住,这是统计学的一种谦卑。它承认“我只是在猜测,所以我得让我的猜测更保守、更准确一点”。这个小小的“-1”,让样本方差能更好地去估算总体方差。一个天上,一个地下。
所以,记住了:
- 你有全部数据,用
VAR.P(Population,总体)。 - 你只有部分数据,想推测全体,用
VAR.S(Sample,样本)。
在工作中,你分析的用户抽样数据、产品抽检数据、某个月的销售数据(用以推测全年的情况)……几乎所有情况,都请毫不犹豫地选择VAR.S。就是它,你最忠实的朋友。
别光说不练,上手盘它!
假设我们有一周的咖啡店日销售杯数(这显然是个样本,因为咖啡店还要继续开下去):
| 日期 | 销量(杯) | | :--- | :--- | | 周一 | 150 | | 周二 | 165 | | 周三 | 140 | | 周四 | 170 | | 周五 | 155 | | 周六 | 210 | | 周日 | 200 |
- 找个空白单元格,输入公式:
=VAR.S(B2:B8)(假设销量数据在B2到B8单元格)。 - 回车。你会得到一个数字:
757.14。
这个757.14就是销量的方差。数字本身有点抽象,对吧?“方差是757.14”这话跟老板一说,他可能比你还懵。
所以,我们通常会请出方差的那个更接地气的兄弟——标准差。
标准差:让方差说人话
标准差(Standard Deviation)其实就是方差的平方根。
它存在的意义,就是把单位给“拽”回来。你想,方差的计算过程里有“平方”这一步,所以它的单位是原始数据的“平方”,比如“杯的平方”,这玩意儿谁能理解?
而标准差,把它开个根号,单位就变回了“杯”。
在Excel里计算标准差,你当然可以=SQRT(VAR.S(B2:B8)),但更直接的方法是用标准差的专属函数。同样,它也有一对双胞胎:
STDEV.P:对应VAR.P,算总体标准差。STDEV.S:对应VAR.S,算样本标准差,也是我们最常用的。
继续上面的例子,我们在另一个单元格输入:=STDEV.S(B2:B8)。
回车,得到结果:27.52。
这下就好解释多了!你可以跟老板说:“老板,我们这周的日均销量是170杯左右,但每天的波动很大,标准差大概是27.5杯。也就是说,销量在(170-27.5)到(170+27.5)这个区间,也就是142杯到197杯之间浮动,是常态。”
你看,是不是一下子就有画面感了?标准差,就是把方差翻译成了人类能听懂的语言。
最后,关于那些老函数,比如VAR和VARP,它们是Excel 2010之前的版本留下的“遗物”。现在为了兼容性还保留着。VAR基本等同于VAR.S,VARP等同于VAR.P。但我的建议是,忘了它们吧,用新的、语义更明确的VAR.S和VAR.P,让你的表格显得更专业,也避免自己搞混。
从一堆冰冷的数字,到理解它们的“脾气”和“性格”,你缺少的,可能就是一个小小的方差公式。它不是什么高深莫测的屠龙之术,它就是你手中的一把游标卡尺,用来精准度量数据世界里的参差与不同。下次再面对一屏幕的数据,别再只满足于一个孤独的平均值了,试试VAR.S和STDEV.S,去听听数据背后,那关于稳定与波动的,真正的故事。
【excel怎么计算方差】相关文章:
excel怎么删除批注12-05
又来了,那张脸。12-05
excel竖列怎么求和12-05
excel怎么筛选名字12-05
excel怎么排序名称12-05
excel怎么计算方差12-05
excel怎么粘贴格式12-05
标题:excel后缀怎么显示12-05
excel主题怎么设置12-05
又是一个被日期折磨的下午。12-05
excel怎么求和时间12-05
怎么制作excel模板12-05