我见过太多人,拿着一份数据,上来就是一个AVERAGE函数,算出个平均值,然后长舒一口气,仿佛洞悉了所有秘密。得了吧,朋友。平均数,很多时候就是个彻-头-彻-尾的“骗子”。它能告诉你数据的“重心”在哪,但它完全没告诉你,这堆数据到底是群纪律严明的士兵,紧密团结在将军(平均值)周围,还是盘各自为战的散沙,东一个西一个,拉开了十万八千里的阵线。
要看透这盘散沙到底有多“散”,你需要的武器,就是标准偏差。
这四个字听起来是不是有点学院派,有点唬人?别怕。把它想象成衡量数据“脾气”的温度计。标准偏差越大,说明数据的脾气越暴躁,数值波动得越厉害,一个个都离平均值老远;反之,标准偏差越小,说明数据脾气越温和,数值们都挨得特别近,是个“团结”的集体。
那么,在Excel这个我们天天打交道的“战场”上,怎么把这个藏在数据深处的“脾气”给揪出来呢?
这事儿,Excel早就替你想好了。你甚至都不用去背那该死的、带着根号的、看起来就让人头疼的数学公式。你只需要认识几个函数,几个长得像亲兄弟的函数。
首先,请出我们的主角家族:STDEV家族。
在最新的Excel版本里(求你了,别再用Office 2003了),你主要会跟这两个家伙打交道:
STDEV.SSTDEV.P
看到那个小尾巴没有?一个.S,一个.P。这可不是Excel开发人员闲得无聊随便加的,这恰恰是计算标准偏差时,你必须做出的第一个,也是最重要的一个抉择。这个选择,甚至带点哲学意味。
它在问你:你手里的数据,是“全部”还是“部分”?
STDEV.P 里的 P,代表 Population,也就是“总体”。什么时候用它?当你非常确定,你Excel表格里的数据,就是你研究对象的“全部家当”了。一个不多,一个不少。比如,你想计算你们部门这50个人上个季度的全部销售额的标准偏差。这50个人就是“总体”,一个不多一个不少。这时候,你就该用 STDEV.P。你就像上帝一样,拥有了完整的、全局的视野。
而 STDEV.S 里的 S,代表 Sample,也就是“样本”。这是我们日常工作中最最最常见的情况。你不可能把全国所有大学生的身高都量一遍,对吧?你只会随机“抽样”,比如抽1000个学生的身高数据。这1000个数据,就是从“全国大学生身高”这个庞大“总体”里抽取出来的一个“样本”。你想用这个样本的标准偏差,去“估计”和“推断”总体的标准偏差。因为样本总归有误差,所以它的计算公式在分母上会稍微调整一下(用n-1而不是n,别问为什么,相信统计学家的智慧),让结果更接近真实的总体情况。
总结一下,说句人话就是:
- 你的数据就是全部,再没别的了?用
STDEV.P。 - 你的数据只是从一个更大的池子里捞出来的一部分?用
STDEV.S。
绝大多数、99%的情况下,你打交道的都是样本数据。所以,如果你实在懒得思考,或者搞不清楚,那么无脑用 STDEV.S,通常错不了。这就像在野外生存,你不知道水干不干净,那就先煮沸了再喝,总归是更安全的选择。
好了,理论说完了,我们来点实际的。
假设,你有一列A1到A100的销售数据,记录了100个不同订单的金额。你想看看这些订单金额的波动情况。
操作简直不要太简单。
- 找一个空白单元格,比如C1。
- 在C1里,敲下键盘,输入:
=STDEV.S(A1:A100) - 然后,潇洒地按下回车键。
Boom!一个数字瞬间就出现在C1单元格里。这个数字,就是你那100个订单金额的样本标准偏差。
假如你非常确定,这100个订单就是你们公司上个月的全部订单,你想计算的是“总体”标准偏差,那么就把公式换成:=STDEV.P(A1:A100)。
看到了吗?Excel把复杂的计算过程完全封装起来了。你只需要喂给它数据范围(A1:A100),然后告诉它你的哲学选择(用.S还是.P),它就会把结果呈现在你面前。
光算出这个数字还不够,你得理解它。
假如你算出来的标准偏差是500。这个500本身没有意义。但如果你对比一下,上上个月的标准偏差是2000,那你立刻就明白了:这个月的订单金额比上上个月稳定多了!客户下的单子,金额大小都比较接近,没有出现那种一个订单几万块、另一个订单几十块的极端情况。这种稳定性,对于预测、备货、现金流管理,意义重大。
再举个例子。你们公司有两个销售,小张和小王。
过去一年,他们俩的月均销售额都是50万,一模一样。光看平均数,你会觉得他们俩业绩一样好,对吧?骗子!平均数又在骗你了。
这时候,你掏出标准偏差这个“照妖镜”。一算,小张的月销售额标准偏差是5万,而小王的标准偏差是30万!
这意味着什么?
这意味着小张是个“稳定输出型选手”。他每个月的业绩都稳稳地在50万上下小幅波动,可能这个月48万,下个月53万。他的表现是可预测的。
而小王,就是个“神经刀”。他的标准偏差高达30万,说明他的业绩极其不稳定。可能这个月饿肚子,只做了5万业绩;下个月突然爆发,签了个200万的大单。然后连续几个月又归于平庸。他的表现是不可预测的,是“过山车式”的。
现在,作为老板,你再看看这两个平均数都是50万的员工,感觉还一样吗?你想提拔谁当主管?你想让谁去带一个重要的、需要持续跟进的项目?答案不言而喻。标准偏差,在这里,揭示了平均数背后隐藏的人性与业务模式。
除了.S和.P,你可能还会遇到两个老家伙。
在一些古老的教程或者旧文件里,你可能会看到 STDEV 和 STDEVP 这两个函数。它们是Excel早期的标准偏差函数。现在,为了兼容性,Excel还保留着它们。
STDEV就等同于现在的STDEV.S(计算样本标准偏差)。STDEVP就等同于现在的STDEV.P(计算总体标准偏差)。
我的建议是,忘了它们吧。拥抱新时代,直接使用带.S和.P后缀的新函数。这样语义更清晰,更能体现你的专业性,也能避免未来可能出现的任何兼容性问题。
最后,说几个实战中的小贴士和注意事项。
- Excel很聪明。 当你用
STDEV.S或STDEV.P函数框选一片数据区域时,它会自动忽略文本、逻辑值(TRUE/FALSE)和空白单元格。你不用费心去清理它们,这很方便。但如果你的数据区域里有错误值(比如#N/A, #DIV/0!),那整个计算就会返回错误。 - 警惕异常值! 标准偏差对“异常值”或者说“极端值”非常敏感。想象一下,你有一组数据
10, 11, 12, 10, 11,它们的标准偏差很小。但如果混进去一个1000,变成了10, 11, 12, 10, 11, 1000,那计算出来的标准偏差会瞬间爆炸式增长。所以,在计算之前,最好先审视一下你的数据,看看有没有明显不合理的录入错误,或者需要单独处理的极端情况。有时候,一个“手滑”多打的零,就能让你的分析结果谬以千里。 - 结合可视化,效果翻倍。 不要只满足于一个冷冰冰的数字。把你的数据做成一个直方图或者箱线图。标准偏差的大小,会直观地体现在图表的“胖瘦”上。一个“瘦高”的直方图,意味着数据集中,标准偏差小;一个“矮胖”的直方图,则意味着数据分散,标准偏差大。数字结合图形,这才是数据分析的完全体。
所以,下次当你想了解一堆数据的真正面貌时,请不要再仅仅满足于那个平庸的、有时甚至会撒谎的平均值了。请多走一步,用 STDEV.S 或 STDEV.P,去计算它的标准偏差。
那一刻,你看到的,将不再是一堆杂乱无章的数字。
你看到的,是这堆数据背后,那躁动不安的、或沉静如水的灵魂。
【别再只盯着平均数了,真的。】相关文章:
excel怎么选单元格12-07
又来了,这个问题。12-07
在excel中怎么移动表格12-07
excel身份证怎么写12-07
怎么在word里面插入excel12-07
别再只盯着平均数了,真的。12-07
Excel怎么做圆饼图12-07
excel表格怎么选中表格12-07
excel怎么作茎叶图12-07
excel加班时间 怎么算的12-07
excel的绝对引用怎么用12-07
excel中怎么做筛选12-07