说起来,Excel里的重复值,简直就是数据整理界的一大头疼!你以为数据干净利落,结果一拉表,哎哟喂,密密麻麻的,同一条信息或者同一家公司名字、同一个人名,愣是能出现好几次。有时候是录入失误,有时候是系统导出来就那样,反正看着就让人抓狂,更别提拿这些脏数据去做统计分析了,结果肯定跑偏到十万八千里。
我刚开始接触Excel那会儿,处理这种事儿全靠肉眼盯,一行一行往下扫,眼睛都快盯瞎了,还老容易漏掉。后来才知道,哪儿用得着那么原始啊,Excel自己就有好些个工具箱,专门对付这些妖魔鬼怪。今天就来唠唠,那些年我是怎么跟Excel里的重复值斗智斗勇的,以及现在常用的一些顺手招儿。
第一招儿,也是最直观的,就是让重复值自己“跳”出来,也就是用条件格式高亮显示。这个办法好,它不会改动你的原始数据,就像给重复项做了个记号。操作特别简单:选中你想检查的那一列或者一片区域,找到“开始”选项卡下的“条件格式”,点开它,鼠标悬停在“突出显示单元格规则”上,然后往右找,“重复值”。点进去,弹出来的框里基本不用改啥,默认就是给重复项填充个颜色,你也可以自己选个喜欢的颜色,比如刺眼的红或者亮黄,一眼就能瞅见。确定!Duang!那些藏头露尾的重复值立马现形,一片一片的,看着还挺有成就感(或者说,成就感建立在之前的痛苦之上)。这个方法特别适合需要保留原始数据,只是想看看重复情况的场景,或者想手动去审视、决定哪些重复项要留,哪些要删。比如说,我整理客户名单,可能允许多个联系人属于同一家公司,但同一个联系人信息(名字+电话)不该重复。用条件格式就能快速定位到那些完全相同的联系人记录,再去人工核对,比瞎蒙强太多了。
但话说回来,光看出来不行啊,很多时候我就是想把重复的清理掉,只留一条。这时候,Excel自带的“删除重复项”功能就派上用场了。这个功能,怎么说呢,用起来那叫一个痛快,咔嚓一下,重复的就没了。但是!用之前务必务必务必留个心眼!一定要备份原始数据!或者至少,在操作前把数据复制一份到新的工作表里再动手。因为“删除重复项”是不可逆的,删了就真没了,没后悔药。操作步骤也 straightforward(直接了当):选中你的数据区域(包含表头),切换到“数据”选项卡,找到“数据工具”组里的“删除重复项”。弹出的窗口里,它会列出你数据区域的所有列标题。这里是关键!你要告诉Excel,基于哪一列或哪几列来判断是不是重复。比如,如果我想判断“姓名”和“身份证号”都一样的才算重复,那我就只勾选“姓名”和“身份证号”这两列。如果我只勾选“姓名”,那只要名字一样就会被认为是重复项,那肯定不对劲,张伟那么多,不能都删了吧?所以这里一定要根据你的实际需求精确勾选。勾好了,点确定。Excel会告诉你删了多少个重复项,保留了多少个唯一值。整个世界瞬间清净了!这个功能效率超高,处理几万条数据眨眼的事儿。适合那种简单粗暴、就是要唯一列表的场景,比如产品SKU列表、员工工号列表等等。
那如果我不想删原始数据,只是想从一堆数据里提取出唯一的清单怎么办?比如我有一张销售明细表,里面有几千条销售记录,同一客户可能买了好多回。我想要一个所有购买过商品的客户的唯一列表,不想要重复的客户名。这时候,“删除重复项”就不合适了,它会直接在原表里动刀。我的选择通常是两种:高级筛选或者用UNIQUE函数(如果你用的是Excel比较新的版本)。
先说高级筛选。这个功能比普通筛选强大多了,也稍微复杂一点点,但学会了简直是个宝!它能做很多事情,提取唯一值就是其中之一。操作是这样的:还是在“数据”选项卡里,找到“排序和筛选”组,点开“高级”。弹出的“高级筛选”对话框里,先看上面,“操作”那里有两个选项,默认是“在原有区域显示筛选结果”,我们不要这个,选“筛选结果复制到其他位置”。然后“列表区域”就是你的原始数据区域,选中它。“条件区域”这里留空,我们不是要按条件筛选,而是要提取唯一值。“复制到”这里,点一下后面的框,然后在你的工作表里找个空白的单元格点一下,告诉Excel你想把提取出来的唯一列表放在哪儿。最后,重点来了!勾选下面的“只保留唯一记录”!这个小小的勾就是提取唯一值的关键。点确定!好家伙,Excel立马在你的指定位置生成了一个只包含唯一值的新列表。这个方法的好处是,它不会动你的原始数据,而且操作相对固定,不容易出错。
另一种是利用函数,特别是Excel 365或2021等较新版本里的UNIQUE函数。这个函数简直是为了解决“提取唯一值”这个需求而生的,语法简单到哭:=UNIQUE(你的数据区域)。比如你的客户名单在A2:A1000区域,你想要唯一的客户列表,随便在一个空白单元格里输入=UNIQUE(A2:A1000),回车!立马生成一个唯一的客户列表,而且是动态的,原始数据更新了,这个列表也会跟着变。不过这个方法对Excel版本有要求,老版本没有这个函数。
说到函数,其实用一些老函数也能辅助识别或提取重复值,比如COUNTIF函数。我可以新建一列,用=COUNTIF(A$2:A2,A2)这个公式(假设你的数据从A2开始),然后向下填充。这个公式的作用是计算当前单元格值在它以及它上面所有单元格里出现了多少次。如果结果大于1,那就说明当前这个值是重复出现的(至少是第二次出现)。然后你就可以基于这一列的结果进行筛选,把那些结果大于1的行筛出来,这些就是重复项。这种方法比较灵活,你可以看到每个重复项出现了多少次,也可以根据这个结果做进一步处理,比如不是简单删除,而是合并、汇总等等。虽然不如“删除重复项”或“UNIQUE函数”一步到位,但提供了更多自定义的可能性。
处理重复值,真不是一招鲜吃遍天,得看你的具体需求和数据量。是想看看重复在哪儿?是想直接删了留唯一?还是想提取一个唯一的清单?摸清自己的目标,再从条件格式、删除重复项、高级筛选、UNIQUE函数或者COUNTIF函数这些工具里挑一个趁手的。我的经验是,小数据量随便哪个都行,大数据量或者需要定期处理的,函数或者“删除重复项”更高效。而如果数据非常非常重要,一点儿都不能错,我宁愿多花点时间,先用条件格式标出来,或者用COUNTIF标记,然后人工或者半自动化地去复核一遍,确保没误删。毕竟,数据这东西,干净才是王道,处理好重复值,能省掉后面多少麻烦啊!别再傻傻地肉眼找了,那些Excel里藏着的小工具,才是解放你双眼的利器!赶紧上手试试,驯服那些 unruly 的重复值吧!
【excel怎么筛选重复值】相关文章:
及格率怎么算excel12-05
excel表格虚线怎么去掉12-05
图片表格怎么转换成excel12-05
excel最大值怎么求12-05
excel怎么裁剪图片12-05
excel怎么整理数据12-05
excel怎么筛选重复值12-05
excel怎么制作图表12-05
excel怎么做直方图12-05
怎么查找Excel重复项12-05
excel怎么插入折线图12-05
excel数据分析怎么做12-05
excel表格筛选怎么做12-05