实战技巧:Excel高效合并两列数据并剔除重复项
📅 2026/6/29 10:52:39
👁️ 次浏览
1. 为什么需要合并两列数据并去重在日常工作中我们经常会遇到需要合并多列数据的情况。比如销售部门和市场部门各自维护了一份客户名单领导要求你整合成一份完整的客户资料又或者你在整理产品信息时不同渠道提供的产品编号存在重复。这时候就需要把两列数据合并起来同时剔除重复项。我遇到过最头疼的情况是处理来自5个分公司的客户数据每份表格的格式都不统一有的用手机号作为客户ID有的用邮箱还有的用自定义编号。最终花了整整一天时间才把这些数据清洗干净。从那以后我就养成了定期整理数据源的习惯也积累了一些高效处理这类问题的方法。2. 使用数组公式实现合并去重2.1 基础数组公式解析数组公式是Excel中非常强大的功能可以同时对一组值进行运算。对于合并两列并去重这个需求我们可以使用以下公式IFERROR( INDEX($B$2:$B$100, MATCH(0, COUNTIF($D$1:D1, $B$2:$B$100), 0)), INDEX($A$2:$A$100, MATCH(0, COUNTIF($D$1:D1, $A$2:$A$100), 0)) )这个公式的工作原理是这样的COUNTIF($D$1:D1, $B$2:$B$100)统计B列数据在当前结果区域出现的次数MATCH(0, ..., 0)查找第一个出现次数为0的值INDEX返回对应位置的值IFERROR处理错误情况当B列没有新数据时转向A列查找2.2 实际应用中的注意事项在使用这个公式时有几个关键点需要注意必须按CtrlShiftEnter组合键输入这样Excel才会把它识别为数组公式公式中的区域引用要根据实际情况调整比如你的数据在A2:B50就需要修改为$A$2:$A$50和$B$2:$B$50结果列的第一个单元格D1建议留空或作为标题行公式需要向下拖动填充直到出现#N/A错误表示所有唯一值都已提取完毕我建议在使用前先备份原始数据因为数组公式一旦出错可能会影响大量单元格。另外如果数据量很大超过1万行数组公式可能会导致Excel运行变慢这时候可以考虑使用其他方法。3. 使用Excel内置功能实现相同效果3.1 删除重复项功能对于不太熟悉公式的用户Excel自带的删除重复项功能可能更友好。操作步骤如下将两列数据复制到同一列中选中这列数据点击数据选项卡找到数据工具组点击删除重复项在弹出的对话框中确认要操作的列点击确定Excel会自动删除重复值这个方法简单直接但有个缺点它会直接修改原始数据。所以我通常会在操作前先复制一份到新的工作表。3.2 数据透视表法数据透视表是另一个强大的工具可以用来合并和去重将两列数据堆叠到一列中可以用复制粘贴或公式实现插入数据透视表将这列数据拖到行标签区域数据透视表会自动显示唯一值列表这个方法的好处是可以随时刷新数据透视表来更新结果而且不会修改原始数据。我经常用它来做临时性的数据检查。4. 进阶技巧与常见问题处理4.1 处理大型数据集当数据量达到数万行时数组公式可能会让Excel变得非常卡顿。这时候可以考虑使用Power QueryExcel 2016及以上版本内置在数据选项卡中选择获取数据将两列数据导入Power Query编辑器使用合并列和删除重复项功能加载回Excel工作表分批次处理数据将数据分成多个小批次处理使用辅助列标记已处理的数据最后合并所有批次的唯一值4.2 处理特殊数据类型有时候数据中可能包含前后有空格的文本大小写不一致的英文看起来相同但实际上不同的字符这时候需要先对数据进行标准化处理TRIM(CLEAN(UPPER(A2)))这个组合公式会先清理不可见字符然后去除首尾空格最后统一转为大写确保比较时不会因为格式问题漏掉重复项。5. 实际案例演示假设我们有以下两列数据A列市场部客户名单A2:A20B列销售部客户名单B2:B30我们要在D列生成合并后的唯一客户列表。步骤1在D2单元格输入数组公式IFERROR( INDEX($B$2:$B$30, MATCH(0, COUNTIF($D$1:D1, $B$2:$B$30), 0)), INDEX($A$2:$A$20, MATCH(0, COUNTIF($D$1:D1, $A$2:$A$20), 0)) )按CtrlShiftEnter确认输入。步骤2向下拖动填充公式直到出现#N/A错误。步骤3选中D列结果复制后选择性粘贴为值避免公式计算带来的性能问题。这个案例中我通常会额外添加一个辅助列来标注每个客户来自哪个部门方便后续分析。可以使用类似这样的公式IF(ISNUMBER(MATCH(D2,$A$2:$A$20,0)),市场部,销售部)6. 性能优化建议在处理大量数据时我总结出几个提升效率的技巧尽量使用精确引用$A$1而不是A1减少公式重算时的负担限制数据范围不要引用整列A:A只引用实际有数据的区域A2:A1000处理完成后将公式结果转为静态值关闭自动计算公式选项卡→计算选项→手动等所有公式输入完成后再按F9计算考虑使用Excel表格CtrlT这样公式引用会自动扩展有一次我处理一个5万行的数据集最初用了整列引用Excel几乎卡死。后来改为精确引用具体范围后处理时间从10分钟缩短到30秒。这个教训让我深刻理解了优化公式的重要性。7. 替代方案比较下表比较了几种不同方法的优缺点方法优点缺点适用场景数组公式动态更新无需额外操作性能差复杂难懂中小型数据集需要自动更新删除重复项简单直接会修改原始数据一次性处理数据量中等数据透视表不修改源数据可刷新需要额外步骤需要定期更新的报表Power Query处理能力强可自动化学习曲线陡峭大型数据集重复性工作根据我的经验日常小规模数据处理用删除重复项最方便定期报表适合数据透视表而需要自动化处理大量数据时Power Query是最佳选择。数组公式虽然强大但除非特别需要动态更新否则我一般不会优先使用。
AI 代币经济模型设计:从激励机制到链上治理的 DApp 工程实践一、代币经济的死亡螺旋:AI DApp 激励设计的核心难题
AI DApp 的代币经济模型面临一个独特的矛盾:AI 推理需要持续消耗计算资源,而代币的价值依赖于稀缺性和需求。如果代…
📅 2026/6/29 10:52:39
1. AMD MI300X平台上的MoE模型训练实践概述在当今大语言模型(LLM)训练领域,混合专家模型(MoE)架构因其能够动态激活参数子集而显著提升模型容量与计算效率,已成为行业研究热点。我们团队基于AMD MI300X GPU和Pollara网络架构,成功完成了ZAYA1…
📅 2026/6/29 10:52:39
3个核心解决方案:如何用EhViewer打造专业级漫画阅读体验 【免费下载链接】EhViewer 🥥 A fork of EhViewer, feature requests are not accepted. Forked from https://gitlab.com/NekoInverter/EhViewer 项目地址: https://gitcode.com/GitHub_Trendi…
📅 2026/6/29 10:52:39
浏览器音乐解密革命:Unlock-Music如何让你真正拥有数字音乐 【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库: 1. https://github.com/unlock-music/unlock-music ;2. https://git.unlock-music.dev/um/web 项目地址: …
📅 2026/6/29 13:23:32
MPC Video Renderer终极指南:如何快速解决视频渲染器常见问题 【免费下载链接】VideoRenderer Внешний видео-рендерер 项目地址: https://gitcode.com/gh_mirrors/vi/VideoRenderer
MPC Video Renderer是一款免费开源的DirectShow视频渲…
📅 2026/6/29 13:23:32
Visual C运行库合集AIO:3分钟解决Windows软件依赖难题 【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist
还在为打开软件时弹出的"找不到MSVCP140.…
📅 2026/6/29 13:23:32
告别昂贵的 SaaS 锁定:深度解析开源电子签名新秀 Dexter 的技术架构与实践
在数字化转型的浪潮中,电子签名技术已成为企业无纸化办公的核心基础设施。长久以来,DocuSign 等商业软件凭借其成熟的产品力占据了市场的主导地位,但其高…
📅 2026/6/29 13:23:32
1. 项目概述与漏洞背景最近在整理内部安全资产时,又回顾了Jenkins历史上几个比较经典的远程代码执行漏洞。CVE-2017-1000353这个编号可能很多人不熟悉,但提到“Jenkins CLI反序列化漏洞”,搞安全研究和做企业内网渗透测试的朋友应该都有印象。…
📅 2026/6/29 13:23:32
如何永久保存微信聊天记录:留痕工具的完整指南 【免费下载链接】WeChatMsg 提取微信聊天记录,将其导出成HTML、Word、CSV文档永久保存,对聊天记录进行分析生成年度聊天报告 项目地址: https://gitcode.com/GitHub_Trending/we/WeChatMsg …
📅 2026/6/29 13:18:30
在商业化内容生产、项目策划、短视频脚本开发场景中,AI模型的创意发散能力、逻辑架构能力、落地执行能力是核心考核指标。不同大模型的训练侧重不同,在方案撰写、脚本创作场景的输出质量差距极大。
为给技术从业者、内容创作者、运营人员提供精准的模型…
📅 2026/6/29 0:00:42
1. 这不是教科书里的“蒙特卡洛离策略”,而是我在强化学习项目里亲手调通的那套逻辑“Monte Carlo Off-Policy Explained”——看到这个标题,别急着去翻Sutton那本绿皮书第5章。我带过三个工业级强化学习落地项目,从智能仓储调度到金融风控策…
📅 2026/6/29 0:00:43
1. 转型背景与核心驱动力最近几年,身边不少做Java后端开发的朋友,都开始或多或少地关注起安全开发这个方向。我自己也是从写了七八年Java业务代码,一步步转向了安全领域,现在主要做代码审计和自动化安全工具开发。这个转变不是一时…
📅 2026/6/29 0:00:43
6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…
📅 2026/6/29 4:18:42
引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…
📅 2026/6/29 4:18:42