搞定Excel里的四分位数,这事儿吧,说难不难,说简单,里头又有点门道。很多人,包括几年前的我,以为不就是个函数嘛,随便拉一个用就行了。结果呢?同一个数据,两个人算出来的结果不一样,对着吵半天,最后发现用的是两个不同的函数。这不就尴尬了吗?所以,今天咱就彻底把这玩意儿掰扯清楚。
你先别急着打开Excel找函数。先想想,我们为什么要用四分位数?
老板让你分析上个季度的销售额,你吭哧吭哧算了个平均值,交上去。老板一看,平均销售额50万,不错啊!结果月底开大会,发现一半的销售业绩都不到20万,全靠几个头部大佬把平均值硬生生给拉上去了。这种“被平均”的痛,你懂的。平均数,就是个“和事佬”,特别容易被极端值(就是那些高得离谱或者低得吓人的数据)带偏。
这时候,四分位数就该登场了。它就像一把快刀,咔咔咔,把一堆乱糟糟的数据从低到高排好队,然后切成四等份。这四个部分的分割点,就是我们要的四分位数。
- 第一个分割点(Q1):也叫下四分位数。25%的数据比它小,75%的数据比它大。它告诉你,排在后25%的“吊车尾”们的上限在哪。
- 第二个分割点(Q2):这哥们儿你肯定熟,就是中位数。一半数据比它小,一半数据比它大。它站在最中间,代表了这堆数据的“中等水平”,完全不受那几个极端值的影响。
- 第三个分割点(Q3):也叫上四分位数。75%的数据比它小,25%的数据比它大。它划出了前25%“优等生”的门槛。
有了这几个数,你再去看那堆销售数据,画面感一下就出来了。Q1是多少,Q3是多少,中间50%的主力部队集中在哪个范围(这个范围也叫四分位距 IQR,是Q3减Q1),老板一听,哦,原来大部分人的业绩是在这个区间里挣扎,那几个头部大佬只是个例。这不比一个干巴巴的平均数,有血有肉多了?
好了,铺垫了这么多,上正菜。Excel里算四分位数,主要有这么两个函数,也是所有混乱的根源:
- QUARTILE.INC
- QUARTILE.EXC
还有一个老掉牙的QUARTILE函数,那是Excel 2007及以前版本的老古董了,现在你只要用新版Excel,它就是QUARTILE.INC的马甲。为了严谨,咱们就当它不存在,聚焦在.INC和.EXC这两个“现代人”身上。
QUARTILE.INC:最接地气的“包含”派
INC是Inclusive的缩写,意思就是“包含”。怎么个包含法?它在计算百分位的时候,把0%和100%这两个端点也给算进去了。
它的语法是这样的:=QUARTILE.INC(array, quart)
array:就是你那堆数据,框选就行。quart:你想要哪个四分位数?- 填
0,给你最小值(0%位置) - 填
1,给你Q1(25%位置) - 填
2,给你Q2,也就是中位数(50%位置) - 填
3,给你Q3(75%位置) - 填
4,给你最大值(100%位置)
- 填
你看,它是不是很符合直觉?从0到4,从最小值到最大值,把整个数据集完完整整地包含了进来。在绝大多数的商业分析、报表制作场景里,用它,准没错。它算出来的结果,和你用手把数据从小到大排好,然后按(n-1)*p(n是数据个数,p是百分比)这个思路去定位,结果是基本一致的。简单、直接、好理解。日常用,我强烈推荐这个。
QUARTILE.EXC:有点学院派的“排除”派
EXC是Exclusive的缩写,意思是“排除”。它就有点“精神洁癖”了。它认为,既然是“分”位数,那分割点本身就不应该等于最小值或最大值。所以,它在计算的时候,把0%和100%这两个端点给排除了。
它的语法长得一样:=QUARTILE.EXC(array, quart)
但是,它的quart参数,就没那么随和了:
array:还是你那堆数据。quart:- 填
1,给你Q1 - 填
2,给你Q2(中位数) - 填
3,给你Q3 - 你敢填0或者4试试?Excel立马给你报个#NUM!的错。 为啥?因为它压根就不承认0%和100%这两个位置的存在。
- 填
QUARTILE.EXC背后的算法逻辑,更偏向于某些统计学流派的定义,它在计算位置时,用的思路更接近(n+1)*p。这就导致,在数据量不大的时候,它算出来的Q1和Q3,会和.INC函数算出来的有那么一丢丢的差异。
实战对决:到底用哪个?
光说不练假把式。咱们来个实例。假设有这么11个销售员的业绩(万元):{5, 8, 10, 15, 18, 20, 22, 25, 30, 35, 50}。
我们来分别算一下Q1和Q3。
-
用QUARTILE.INC:
=QUARTILE.INC(A1:A11, 1)结果是 12.5=QUARTILE.INC(A1:A11, 3)结果是 27.5
-
用QUARTILE.EXC:
=QUARTILE.EXC(A1:A11, 1)结果是 10=QUARTILE.EXC(A1:A11, 3)结果是 30
看到了吧?结果真的不一样!
INC算出来的Q1是12.5,在10和15之间;Q3是27.5,在25和30之间。这是一种“加权平均”的算法,它认为分割点可以落在两个实际数据之间。
EXC算出来的Q1直接就是10,Q3直接就是30。这是另一种算法流派,它倾向于直接取某个位置上的实际数据值。
那问题来了,哪个对?
答案是:都对,也都不对。
这取决于你遵循哪种统计学定义。但别慌,对于我们绝大多数办公室里的“表哥表姐”来说,这个问题没那么玄学。你只需要记住一个原则:
一致性比绝对正确更重要。
如果你在做一个系列报告,或者你的公司内部有数据分析规范,那么请永远使用同一种函数。别这次用.INC,下次用.EXC,自己跟自己打架。
如果非要我给个建议,那我还是那句话:无脑用 QUARTILE.INC。
理由很简单: 1. 它和绝大多数数据分析软件(比如Python里的Pandas库)的默认计算方式兼容,你把数据导出去用别的工具分析,结果能对得上。 2. 它能计算最小值和最大值,功能更完整,用起来方便。 3. 它的逻辑更符合我们对“百分位”的普遍认知。
除非你的工作是写统计学论文,或者你的老板是个统计学博士,特别指定要用“排除端点”的算法,否则,请把QUARTILE.EXC忘掉吧,它只会给你徒增烦恼。
进阶一步:从数字到图形
算出了四分位数,就这么放着?太浪费了。这几个数字最大的价值,是用来画箱线图(Box Plot)。
在Excel里,你选中原始数据,然后去“插入” -> “图表” -> “统计图表”里,就能找到“箱形图”。Excel会自动帮你把Q1、Q3、中位数、最大最小值全都计算并画出来。那个中间的“箱子”,就是从Q1到Q3,代表了中间50%数据的分布范围。箱子越窄,说明数据越集中;箱子越宽,说明数据越分散。箱子上下伸出去的“胡须”,则代表了数据的延展范围。有时候你还会看到一些孤零零的点,那些就是被识别出来的“异常值”。
一张箱线图,信息量瞬间爆炸,比你列一堆数字,或者画个简单的柱状图,要专业得多,也更能洞察问题。而这一切,都源于你对QUARTILE.INC和QUARTILE.EXC那一点点深入的理解。
说到底,工具是死的,人是活的。懂了INC和EXC背后的那点小九九,你才能在老板或者客户面前,把数据故事讲得明明白白,而不是被一个简单的函数给绕进去。这,才是数据分析的真正魅力所在。
【四分位数在excel怎么算】相关文章:
excel下拉二级菜单怎么做12-05
excel怎么设置文本框的边框颜色12-05
我敢打赌,每一个跟Excel打过交道的人,都曾被那个小小的、黑色的十字光标逼到抓狂。12-05
怎么把excel设置成a412-05
excel的页眉怎么设置页码不连续页码12-05
打印excel打印不出来怎么回事12-05
四分位数在excel怎么算12-05
碰上这事儿,简直能把人逼疯。12-05
excel左上角的三角怎么去掉12-05
我敢打赌,每个和Excel打过交道的人,都经历过那个让人血压飙升的瞬间。12-05
excel怎么设置文本框的边框颜色设置12-05
excel被隐藏的列怎么显示出来的12-05
excel截图怎么截图快捷键是什么原因12-05