真的。
太多人了,一拿到数据,脑子里就只有柱状图、折线图、饼图这“老三样”。不是说它们不好,但在某些场景下,用它们简直就是对数据的谋杀。尤其当你手上握着两组看起来“可能有点关系”的变量时,不用 散点图 去瞅一眼,那简直是暴殄天物。
想象一个场景。你老板丢给你一份数据,一列是过去一年每天的广告投入,另一列是每天的销售额。他问你:“咱们这广告,投得值不值?”
你怎么办?
做个柱状图?两根柱子,一根是总广告费,一根是总销售额?这能说明啥?啥也说明不了。做个折线图?两条线,一条广告费的波动,一条销售额的波动,然后你瞪大眼睛在两条扭曲的线上找规律?累不累啊。
这时候,就该 散点图 登场了。
它不是为了展示一个单一维度的“多少”或者“趋势”,它的存在,是为了揭示两组数据之间那种看不见摸不着,却又真实存在的 相关性。它就像数据世界的月老,专门给两列数字牵红线,看看它们到底是不是一对儿。
来,咱们动手捣鼓一个。
过程简单到令人发指。选中你那两列数据,比如A列是广告投入,B列是销售额。然后,点击Excel菜单栏里的“插入”,在图表那一堆花里胡哨的选项里,找到那个长得像一脸雀斑的图标,那就是 散点图。点下去。
“砰”的一声,一张图就跳出来了。
第一次看,你可能会觉得,这什么玩意儿?一堆乱七八糟的点,像不小心把墨水甩在了纸上。别急。这堆看似杂乱的点,就是你数据的灵魂肖像。每一个点,都是一个独立的数据对。它的横坐标(X轴)值来自你的第一列数据(广告投入),纵坐标(Y轴)值来自你的第二列(销售额)。
现在,你要做的,不是去数有多少个点,而是退后一步,眯起眼睛,像欣赏一幅印象派画作一样,去看这堆点的整体形态。
这堆点,它们有没有形成某种“队形”?
如果这些点,整体上呈现出一种从左下角向右上角攀升的趋势,像一群积极向上的小蜜蜂,那恭喜你,你发现了 正相关。这就意味着,通常情况下,广告投入 越高,销售额 也越高。老板要的答案,这不就有了?你可以理直气壮地告诉他:“老板,钱没白花,多投多赚!”
反过来,如果这些点是从左上角向右下角溜达,像滑滑梯一样,那就是 负相关。比如,你分析的是“员工摸鱼时长”和“KPI完成度”,出现这种形态就再正常不过了。一个变量增加,另一个变量就减少。
最怕的是什么?是这堆点,东一个西一个,像满天繁星,毫无规律可言。你看不出任何倾斜的趋势,它们就那么均匀地、随机地散布在整个图表区域。这种情况,就说明这两个变量之间,可能压根就没啥关系。比如你拿“程序员的头发数量”和“代码行数”去做图,大概率就是这个结果。这时候,你也得到了一个结论,一个同样有价值的结论:别再指望靠A去影响B了,它们活在两个世界。
看懂了整体趋势,还没完。散点图 的另一个魅力在于,它能让你一眼就揪出那些“不合群的家伙”—— 离群值。
在一大堆抱团取暖的点中间,总有那么一两个点,孤独地待在角落里,离大部队远远的。这些点,就是故事的开始。
比如,在你的广告销售散点图里,大部分点都乖乖地排成一条向上的带子,但有一个点,它的横坐标(广告投入)很低,但纵坐标(销售额)却高得吓人。这个点在说什么?它在说:“嘿!看我!那天我们没花多少广告费,但销售额爆了!” 这是为什么?是那天搞了什么线下活动?还是有个网红无意中推荐了你们的产品?这个 离群值 就是一个金矿,它在提示你一个潜在的、非广告驱动的增长点。
反之,如果有个点,广告费(X轴)高得离谱,销售额(Y轴)却趴在地上,它就是一个警钟。那天发生了什么?广告投给了假博主?还是产品链接挂错了?不把这个异常点查清楚,你睡觉都睡不踏实。
所以你看,散点图 不仅仅是画个图,它是在邀请你和数据对话。
聊到这,必须得提一个 散点图 的灵魂伴侣—— 趋势线。
光看点的分布,有时候还是有点模糊。Excel很贴心,可以帮你画一条线,来概括这堆点的总体趋势。在图表上右键点击任意一个数据点,选择“添加趋势线”。
一条直线(或者曲线,你可以选)就会穿过这堆数据点。这条线,就是对你的数据关系做的一个最精炼的总结。它告诉你,平均来看,你的数据是朝哪个方向发展的。
更绝的是,在设置趋势线格式的面板里,你可以勾选一个叫做“显示R平方值”的选项。这个 R²,行话叫决定系数,你别管它叫啥,你就把它理解成一个“靠谱指数”。
这个 R² 的值在0到1之间。越接近1,说明你画的这条 趋势线 对数据点的拟合程度越好,代表着X和Y之间的线性关系越强。简单说,R² 越高,你那条线就越能代表数据的真实趋势,你的结论(比如“广告投入和销售额正相关”)就越站得住脚。如果一个 R² 只有0.1,那你这条趋势线基本就是个摆设,X和Y的关系弱到可以忽略不计。这个小小的数字,是你结论含金量的重要保证。
当然,散点图 还能玩出更多花样。
比如,当你手上有三个变量时怎么办?广告投入、销售额、还有利润率。散点图 也能搞定,这时候就要用到它的变体—— 气泡图。
气泡图 本质上还是散点图,X轴是广告投入,Y轴是销售额,但每个点不再是同样大小,而是用点(气泡)的大小来表示第三个变量——利润率。这样,你一眼就能看出,哪些是“投入高、销售高、利润也高”的明星业务,哪些是“投入高、销售高、但利润薄如纸”的赔钱赚吆喝的买卖。一张图,三个维度的信息,清清楚楚。
最后,我想泼一盆冷水,也是所有数据分析师都该刻在骨子里的一句话:相关不等于因果。
夏天,冰淇淋的销量和溺水人数都会上升,如果你把这两个数据做成 散点图,会发现它们呈现出极强的 正相关。但你能说“吃冰淇淋导致溺水”吗?不能。因为背后有一个共同的原因——气温升高。
散点图 只能告诉你两个变量“看起来”同步变化,但它无法告诉你谁是因,谁是果,或者它们是不是被同一个“幕后黑手”操纵着。揭示因果关系,需要更严谨的逻辑推理和实验设计。
所以,别再把 散点图 当成Excel里一个可有可无的功能了。它是一种思维方式。一种在两组看似无关的数据之间,寻找蛛丝马迹、挖掘潜在故事的侦探思维。
下一次,当你面对两列数据感到迷茫时,别犹豫。
让 散点图 来帮你开口,听听你的数据,到底想对你说些什么。
【我跟你说,Excel里头,最被低估的图表,绝对是散点图。】相关文章:
我跟你讲,每次一提到“把Excel里的图片导出来”这个话题,我血压就有点往上飙。12-06
“小王,把这个季度的用户数据拉一下,给我个Excel。”12-06
excel的占百分比怎么算的12-06
excel怎么把表格复制到另一个表格12-06
excel怎么让两个表格合并单元格的内容12-06
excel怎么计算日期12-06
我跟你说,Excel里头,最被低估的图表,绝对是散点图。12-06
excel乘法怎么求和12-06
讲真,每次有人问我Excel怎么插入链接,我脑子里都不是那个冷冰冰的操作步骤。12-06
excel文件怎么压缩12-06
怎么关闭excel检索12-06
Excel怎么填充序列12-06
excel表格怎么加数12-06