又是一个昏昏欲睡的下午,你面前摊开一个几千甚至上万行的表格,客户名单、销售记录、物料清单……密密麻麻,看得你眼睛都快瞎了,老板还在旁边催着要一个精准的汇总数据。你战战兢兢地做完求和、平均,可心里总感觉不对劲,好像哪里藏着地雷。没错,那个地雷就是——重复值。
一个客户被录入两次,一份订单被计算了三回,一个物料编码对应了俩不同的品名。这些该死的重复数据,就是你报表不准、数据分析翻车、加班到深夜的万恶之源。所以,怎么在Excel里把这些捣蛋鬼揪出来,就成了我们这些“表哥表姐”的看家本领,是核心中的核心。
别慌,这事儿没那么玄乎。今天我就不跟你扯那些干巴巴的教科书理论,咱们聊点实在的,能直接上手干活的招数。
第一招:肉眼可见的魔法——【条件格式】
这是最直观、最没脑子,也最常用的一招。我管它叫“荧光笔大法”。你想想,让你在一大堆文件里找重复的句子,你是不是下意识就拿起荧光笔给它涂上颜色?Excel的条件格式干的就是这个活。
操作起来简直不要太简单:
- 选中你要查找重复值的那一列,或者好几列。比如,你要查客户名称有没有重复,那就把“客户名称”那一整列给框起来。
- 然后,在菜单栏里找到“开始”选项卡,往右边瞅,看到那个叫“条件格式”的大按钮没?点它!
- 鼠标放上去,会弹出来一堆选项,别被吓到。咱们的目标明确,直接找“突出显示单元格规则”,然后里面就藏着我们的大宝贝——“重复值”。
- 点一下“重复值”,会跳出来一个小窗口。它默认就是把“重复”的值用“浅红填充色深红色文本”给标记出来。你当然也可以换成你喜欢的颜色,比如骚气的紫色或者清新的绿色,随你高兴。
- 点“确定”。
Duang!一瞬间,所有重复的数据都被你用选定的颜色“揪”了出来,清清楚楚,一目了然。是不是感觉特有成就感?
这一招的优点是快、准、狠,一眼就能看到问题所在。但它的缺点也很明显——它只是给你标了个颜色,告诉你“嘿,这儿有情况”,但它没帮你处理。你还得自己一个一个去看,去决定怎么搞定这些重复的家伙。对于那种数据量爆棚的表格,光是看这些花花绿绿的标记,也够你看一阵子的了。
所以,这招适合快速预览,做个初步诊断。
第二招:侦探的放大镜——【COUNTIF函数】
如果说条件格式是荧光笔,那COUNTIF函数就是侦探手里的放大镜,它能帮你做得更精细。它不再是简单地告诉你“有”还是“没有”,而是能明确告诉你,这个值,它到底出现了几次。
这玩意儿听起来像个函数,好像很高深,其实捅破了那层窗户纸,简单得很。
它的语法是这样的:=COUNTIF(range, criteria)
翻译成大白话就是:=COUNTIF(在哪儿找, 找什么)
举个栗子。假设你的客户名单在A列,从A2单元格开始。你想知道A2这个客户“张三”,在整个A列里出现了几次。你可以在旁边B2单元格里输入这个公式:
=COUNTIF(A:A, A2)
解释一下:
A:A就是我们要查找的范围,也就是整个A列。为了性能考虑,你也可以用一个精确的范围,比如$A$2:$A$5000,记得用$锁定,这样你往下拖公式的时候范围才不会乱跑。A2就是我们要查找的目标,也就是当前行的这个客户名。
输完公式一回车,一个数字就出来了。如果结果是1,恭喜你,这是个独一无二的好同志。如果结果是2、3、4……那它就是个重复值,而且数字越大,说明它重复得越离谱。
然后,选中B2这个单元格,把鼠标放在右下角那个小黑点上,变成十字形,双击一下!神奇的事情发生了,整个B列瞬间就帮你把A列所有数据的出现次数全都计算出来了。
有了这个“出现次数”列,你能干的事儿就多了去了!
- 你可以给B列加个筛选,只看那些值大于1的行,所有重复的数据就都被你筛选出来了。
- 你可以按B列降序排序,那些重复次数最多的“惯犯”就排在最前面,让你优先处理。
看到了吗?COUNTIF给了你处理重复值的权力。它不仅仅是发现问题,更是为解决问题提供了依据。这一招,是真正的数据处理思维,强烈推荐掌握。
第三招:上帝视角——【数据透视表】
有时候,我们不关心具体哪一行和哪一行重复了,我们更想知道一个宏观的情况:到底有哪些值是重复的?它们各自重复了多少次?
这时候,就该数据透视表这个大杀器登场了。
用数据透视表来找重复值,简直就是降维打击。
步骤如下:
- 选中你的数据区域。
- 在“插入”选项卡里,找到最左边的“数据透视表”。
- 点一下,基本不用改什么设置,直接点“确定”,Excel会为你新建一个工作表。
- 在新工作表的右侧,你会看到一个“数据透视表字段”的窗格。这里就是你的指挥中心。
- 把你要检查重复值的那个字段(比如“客户名称”)用鼠标拖动到下面的“行”区域。
- 再把同一个字段(没错,还是“客户名称”),再拖一次,这次拖到“值”区域。
一松手,奇迹发生。左边的数据透视表瞬间就生成了一个列表,列出了所有不重复的客户名称,以及每个名称在原始数据里出现的次数(它默认是“计数”)。
现在,你只需要对着这个计数结果,点一下筛选按钮,或者直接右键排序,选择“降序”。
所有出现次数大于1的“坏分子”就都暴露无遗了。这个列表干净、清爽,让你对整个数据的重复情况有一个全局的、战略性的把握。这就是我说的“上帝视角”。
第四招:一键搞定,简单粗暴——【删除重复项】
好了,前面说的都是“找”,现在说个“删”的。
Excel其实内置了一个非常直接的功能,就叫“删除重复项”。它藏在“数据”选项卡里。
这个功能简单粗暴,但有效。
- 选中你的数据区域。
- 点击“数据”选项卡里的“删除重复项”。
- 会弹出一个窗口,让你选择要根据哪些列来判断重复。比如,你只勾选了“客户名称”,那么只要客户名称相同,不管其他信息(比如电话、地址)是否一样,它都会被认为是重复项,只保留第一个出现的,删掉后面的。如果你同时勾选了“客户名称”和“联系电话”,那么只有在这两列内容都完全一样的情况下,才会被判定为重复。
- 选好之后,点“确定”。
Excel会“唰”地一下帮你把重复的数据干掉,然后弹出一个报告,告诉你它删除了多少个重复值,还剩下多少个唯一值。
但是!但是!但是!重要的事情说三遍。
这一招是毁灭性的,它会直接修改你的原始数据,删掉的东西可就找不回来了!所以,在用这招之前,我求你了,一定一定一定先备份你的原始数据!复制一个工作表出来再操作,不然万一删错了,哭都没地方哭去。
我个人其实不太常用这个功能,除非我非常确定我就是要一个干净的、唯一的列表。大多数时候,我还是倾向于用前面几招先把重复值找出来,再人工判断如何处理,是合并信息,还是确认后删除。
终极武器:Power Query
如果上面这些你都觉得是小打小闹,你面对的是动辄几十万行的数据,而且这种查重的工作每个月、每一周甚至每一天都要做,那么,我必须向你祭出真正的神器——Power Query。
这玩意儿在Excel 2016及之后的版本里已经内置了(在“数据”选项卡下,叫“获取和转换数据”),它不是一个简单的功能,而是一个强大的数据处理引擎。
用Power Query处理重复值,思路完全不一样。你是在建立一个“数据清洗流水线”。
你只需要设置一次规则(比如,从某个文件获取数据 -> 剔除重复项 -> 加载到工作表),以后每次你的源数据更新了,你只需要点一下“刷新”,所有步骤都会自动重跑一遍,瞬间给你一个干净的结果。
这已经超出了“查找”的范畴,进入了“自动化数据处理”的领域。具体操作有点复杂,这里就不展开了,但你一定要知道,有这么个神器的存在。当你被重复性的数据处理工作折磨得痛不欲生时,去学学它,它会解放你的。
总而言之,查找重复值这事儿,没有最好的方法,只有最适合你当前场景的方法。
- 想快速看一眼?用条件格式。
- 想深入分析,并为后续处理做准备?用COUNTIF。
- 想从宏观上掌握重复情况?用数据透视表。
- 想一刀切,直接删掉?用删除重复项(记得备份!)。
- 想一劳永逸,实现自动化?去拥抱Power Query。
数据清洗是门手艺活,也是一门艺术。把这些招数练熟了,下次再面对那堆乱七八糟的数据时,你就可以从容地笑一笑,而不是皱着眉头加班了。
【怎么在excel查找重复值】相关文章:
excel日期怎么修改日期12-05
excel怎么作曲线图12-05
怎么把excel表分开显示12-05
怎么excel中输入公式计算12-05
怎么在excel表格插入公式12-05
excel怎么上下移动表格12-05
怎么在excel查找重复值12-05
别跟我提Excel日期格式,一提就来气。12-05
在excel中怎么分类汇总12-05
Excel怎么调整行高自动12-05
苹果电脑excel怎么编辑12-05
excel怎么等比数列12-05
那份Excel,简直就是个数字泥潭。12-05