哎呀妈呀,手里头这份 Excel 表,密密麻麻的,光是看着就头大,更别说里面可能藏着一大堆重复项了!客户名单重复了,商品编码重复了,员工信息输重了……遇上这种事,心都凉半截。咋整啊?难不成真要我一笔一笔、一行一行用眼睛去对?想都别想,那简直是浪费生命,眼睛都快看花了还没对完,还容易看漏!
所以,咱们得使点巧劲儿。Excel 这玩意儿,虽然有时候挺气人的,但对付这种重复项的问题,它肚子里还是有几招的,而且,嘿嘿,都还挺管用的。咱们今天就掰扯掰扯,到底有哪几种法子,能把那些 pesky 的重复数据给“揪”出来。
第一招,也是我最开始接触 Excel 数据处理时,觉得最神奇、最直观的一招:条件格式。
你想啊,重复的数据就跟人群里的双胞胎似的,一眼看过去,你能分出来吗?难!但如果他们俩身上突然都亮起了红灯,那可就太醒目了!条件格式干的就是这事儿。它不改变你的数据本身,它就是个“显微镜”,帮你把符合你设定的“重复”条件的单元格或行,给标记出来,通常就是变个颜色,加个底纹啥的。贼简单!
怎么操作呢?选中你觉得可能有重复数据的那个区域(比如一列姓名,或者多列你想一起比较的)。然后点数据选项卡里的那个“条件格式”小按钮,下拉菜单里有个选项叫做“突出显示单元格规则”,再往右看,有个“重复值”。点它!弹出一个小窗口,你甚至可以选择用什么颜色来突出显示,选好了点确定。
“Duang!”的一下,奇迹发生了!你选中的区域里,所有重复出现过的值,瞬间就披上了你指定的颜色外衣,跳到你眼前!那种感觉,就像在杂草丛里找到了目标植物,又快又准!
条件格式的好处是什么?直观!快!而且是无损的,它只是“看”,不“动”你的数据。
那缺点呢?它主要用来“看”。如果你的数据量巨大,成千上万行,密密麻麻的彩色块块可能看着更晕。而且,它只负责标记,标记完了,你要删除还是留着,还得你自己手动去处理。这就像是告诉你谁是双胞胎,但没帮你把其中一个请出去。
所以,如果你只是想快速看看有没有重复,或者想知道重复在哪里,条件格式绝对是你的首选,又快又直观!
行,光看出来不过瘾啊,我就是要清!我就是要删掉那些多余的!这时候,咱们就要请出第二位大神了:删除重复项。
这玩意儿,名字就简单粗暴,干的事儿也一样。它是 Excel 内置的一个功能,专门用来帮你一键搞定数据清洗里的重复项问题。
去哪找呢?还是在“数据”选项卡里,通常在“数据工具”那个分组里,有个图标看起来像一个列表上面叠了一个小红叉,文字提示就是“删除重复项”。
点开它,弹出的窗口会列出你选中的数据区域的所有列的列标题。这里是重点!它会问你,“基于哪几列来判断重复?”。这个选择至关重要!
比如说,你有一份客户名单:姓名、电话、地址。 如果你只勾选“姓名”,那只要姓名一样,就被认为是重复,哪怕是同名不同人(张三 李四)。 如果你勾选“姓名”和“电话”,那只有当姓名和电话都一样的时候,才算重复。 如果你勾选了所有列,那就要求整行数据一模一样才算重复。
所以,你得想清楚,你的“重复”定义是什么?是同一个人(可能姓名一样,电话地址都一样),还是同一个名字就够了,还是同一个商品编码就够了?选对了列,点确定。
Excel 会跳出来告诉你,“已删除 X 个重复值,保留 Y 个唯一值”。然后你的数据区域就瞬间“瘦身”了!那种“一键搞定”的爽快,谁用谁知道!
删除重复项的优点:直接!高效!是真正的数据清洗利器。几千几万行数据,秒级处理。
缺点嘛,它不可逆!删了就是删了,除非你立即按 Ctrl+Z 撤销。所以,用这功能之前,强烈建议先备份你的数据!复制一份到新的工作表里再操作,养成这个好习惯,能救你N次命。而且它比较死板,只能基于列完全匹配来判断,没法做模糊匹配或者更复杂的条件判断。
好,前面两个是“所见即所得”或者“一步到位”的招式。但有时候,我不想直接删,我只想把重复的标记出来,或者我想知道某个数据到底重复了几次?再或者,我想做更精细的控制,比如只找出电话号码重复的客户?这时候,公式就该上场了!
请出第三位大神:COUNTIF 函数。
这是个统计函数,它的作用是“统计某个区域内符合指定条件的单元格数量”。咱们可以利用它来统计某个值在咱们的数据区域里出现了多少次。
比如,你的姓名列在 A 列,从 A2 开始。你在 B2 单元格里输入公式 =COUNTIF(A:A, A2)。
这个公式啥意思?“在整个 A 列 (A:A) 里,统计一下内容等于 A2 单元格 (A2) 的有多少个。”
然后把 B2 单元格的公式向下拖动填充到所有数据行。
这样,B 列就变成了一个“出现次数统计”列。如果 B 列某个单元格的值是 1,说明对应的 A 列数据是唯一的。如果大于 1 (比如 2 或 3),那就说明对应的 A 列数据出现了 2 次或 3 次,它就是个重复项!
你看,通过这个公式,你不仅知道有没有重复,还知道重复了多少次!这可是前面两个方法做不到的。
用 COUNTIF 标记出重复项后,你可以利用 Excel 的筛选功能,筛选 B 列中值大于 1 的行,这样就能轻松地把所有重复的行都筛选出来,然后你想复制、粘贴、删除、标记,随你便!灵活性超高!
COUNTIF 的优点:灵活!强大!不仅能找出重复,还能统计次数。可以结合其他函数(比如 IF 函数)来做出更复杂的判断和标记,比如 =IF(COUNTIF(A:A,A2)>1,"重复",""),直接在B列显示“重复”或空白。而且,你可以用它来检查多列组合的重复,比如在C2输入=COUNTIFS(A:A,A2,B:B,B2),统计A列等于A2且B列等于B2的次数,这样就能找出A列和B列都重复的行。
缺点嘛,对于特别巨大的表格,COUNTIF 公式可能会让文件变得计算缓慢。而且,它只是标记,后续的清理工作还得你手动或者结合筛选来完成。
还有没有别的招?当然有!第四招,稍微有点被忽视但实力不俗的:高级筛选。
这个功能隐藏得比较深,但用好了也挺厉害。它在“数据”选项卡里,“排序和筛选”分组里,有个“高级”。
高级筛选有个特别有用的功能,就是可以直接“筛选不重复的记录到当前位置”或者“筛选不重复的记录到其他位置”。
操作起来稍微比前面几个复杂一丢丢:选中数据区域,点“高级”,在弹出的窗口里,你可以选择“在原有区域显示筛选结果”或者“将筛选结果复制到其他位置”。勾选“仅显示不重复的记录”。确定。
奇迹又来了!如果选择在原区域显示,你的表格就只剩下唯一的、不重复的行了(那些重复的都被隐藏了)。如果选择复制到其他位置,Excel 会在你指定的地方生成一个新的表格,里面全是不重复的唯一数据!
高级筛选的优点:直接生成唯一值列表,非常方便如果你只是想要一份去重后的数据。或者可以用来找出哪些是唯一的,哪些是重复的(通过对比原表和筛选后的表)。
缺点:界面稍微复杂,新手可能不太敢碰。而且它主要用来获取“唯一值”,想直接列出“重复”项的思路略微绕一点(你可以筛选出唯一值,再用 COUNTIF 或其他方法跟原表比对,找出原表中有但唯一值列表没有的,它们就是重复项,但这思路比较复杂)。
最后,如果你经常要处理这种重复数据,或者数据量大到前面这些方法都开始吃力,甚至你的数据来源五花八门、需要先清洗合并才能处理,那么,是时候请出 Excel 里的“核武器”了:Power Query!
Power Query(在 Excel 新版本里叫“获取和转换数据”)是个独立的数据处理引擎,你可以把它想象成一个小型的ETL工具(提取、转换、加载)。找出和处理重复项,对它来说简直是小菜一碟。
通过“数据”选项卡里的“从表格/区域”导入你的数据到 Power Query 编辑器里。在编辑器里,选中你想检查重复的列,鼠标右键,你会看到有“移除重复项”或者“保留重复项”这两个选项。
“移除重复项”:直接就把重复的行干掉了,留下唯一值。比 Excel 表格里的“删除重复项”更强大,因为 Power Query 能处理更多数据类型,而且这个步骤会记录下来,下次数据源更新,只需要刷新一下查询,重复项就自动被移除了,非常适合自动化!
“保留重复项”:这个就厉害了!点它,你的表格里就只剩下那些“是重复项”的行了。这正是我们用 COUNTIF 筛选大于1时想要的结果!Power Query 一步到位帮你搞定!
Power Query的优点:自动化、高效、能处理大数据、可以结合其他清洗步骤。一旦设置好查询,后续只需要刷新。这是处理复杂、周期性数据任务的终极利器。
缺点:学习曲线相对前面几个要陡峭一些。界面和操作逻辑跟 Excel 表格本身不太一样,需要花点时间去理解。
你看,小小一个“查询重复”,Excel 就提供了这么多路子。从最简单直观的条件格式,到一步到位的删除重复项,再到灵活强大的COUNTIF公式,再到被低估的高级筛选,最后是面向未来的自动化利器Power Query。
选哪个?得看你的具体需求。 只是想看看?条件格式走起。 想快速清理一份简单列表?删除重复项,记得备份。 想统计重复次数、做复杂条件判断或不想动原数据?COUNTIF 是你的好帮手,搭配筛选更佳。 想快速提取一份去重后的干净列表?试试高级筛选的“仅显示不重复记录”。 需要定期处理、数据量大、或者数据需要先合并清洗?直接上Power Query,一劳永逸。
总而言之,别再傻傻地用眼睛去对了,Excel 已经把工具摆在你面前了,挑一个顺手的,让它帮你把那些捣乱的重复项统统搞定吧!数据干净了,心情都舒畅不少!
【excel怎么查询重复】相关文章:
excel表格怎么截屏12-05
excel怎么取消函数12-05
excel字体怎么竖着12-05
excel怎么设置网格线12-05
excel网格线怎么设置12-05
excel表格怎么居中打印12-05
excel怎么查询重复12-05
excel表格怎么分页打印12-05
excel条件格式怎么用12-05
excel自动保存怎么设置12-05
Excel下拉数字不变?这事儿我可太有发言权了!当年为了这,我可没少挠头。12-05
excel怎么把行变成列12-05
excel及格率怎么算12-05