删除Excel中的重复数据记录
Excel等电子表格程序通常用作零件库存,销售记录和邮件列表等数据库。
Excel中的数据库由数据表组成,这些数据表通常被组织成称为记录的数据行。
在记录中,行中每个单元格或字段中的数据是相关的 - 例如公司的名称,地址和电话号码。
随着数据库大小增加而出现的常见问题是重复记录或数据行。
如果出现以下情况,可能会发生
- 整个记录不止一次输入数据库,从而产生两个或多个相同的记录
- 多个记录包含一个或多个字段 - 例如名称和地址 - 包含相同的数据。
无论哪种方式,重复记录都可能导致一系列问题 - 例如在邮件合并中使用数据库信息时将多个文档副本邮寄给同一个人 - 因此最好扫描并删除常规的重复记录基础。
虽然很容易在上面图片中的小样本中挑选出重复记录,但数据表可能很容易包含数百条(如果不是数千条)记录,因此很难找出重复记录 - 尤其是部分匹配记录。
为了更容易完成此任务,Excel有一个内置的数据工具,毫不奇怪, 删除重复项,可用于查找和删除相同和部分匹配的记录。
但是,顺便说一下 删除重复项 工具设计,相同和部分匹配的记录必须单独处理。
这是因为 删除重复项 对话框显示所选数据表的字段名称,并选择要在搜索匹配记录时包含的字段:
- 对于相同的记录,搜索所有字段 - 在所有列或字段名称旁边留下复选标记;
- 对于部分匹配的记录 - 仅在那些要匹配的字段旁边留下复选标记。
字段名称与列字母
如上所述, 删除重复项 工具包含一个对话框,您可以通过选中所需的字段或列名来选择要搜索的匹配字段。
对话框显示的信息 - 字段名称或列字母 - 取决于您的数据是否包含一行标题 - 或 头 - 如上图所示,位于数据表的顶部。
如果是 - 请确保对话框右侧的选项 - 我的数据有标题 - 已选中,Excel将在此行中将名称显示为对话框中的字段名称。
如果您的数据没有标题行,则对话框将在对话框中显示所选数据范围的相应列字母。
连续的数据范围
为了 删除重复项 工具正常工作,数据表必须是一个连续的数据范围 - 也就是说,它不能有任何空行,列,并且如果可能的话,表中不能有空单元格。
在数据表中没有空白是一般的数据管理,而不仅仅是在搜索重复数据时。 Excel的其他数据工具(如排序和过滤)在数据表是连续的数据范围时效果最佳。
删除重复数据记录示例
在上图中,数据表包含两个相同的记录 A.汤普森 和两个部分匹配的记录 R.霍尔特 - 所有字段匹配,但学号除外。
下面列出的步骤详细说明了如何使用 删除重复项 数据工具:
- 删除两个相同记录中的第二个 A.汤普森 .
- 删除第二个部分匹配的记录 R.霍尔特 .
打开“删除重复项”对话框
- 单击示例数据库中包含数据的任何单元格。
- 点击 数据 功能区上的选项卡。
- 点击 删除重复项 图标突出显示数据表中的所有数据并打开 删除重复项 对话框。
- 该 删除重复项 对话框显示数据样本中的所有列标题或字段名称
- 字段名称旁边的复选标记表示Excel在搜索重复记录时将尝试匹配哪些列
- 默认情况下,当对话框打开时,将检查所有字段名称
寻找相同的记录
- 由于我们在此示例中搜索完全相同的记录,因此我们将检查所有列标题
- 点击 好
此时应该看到以下结果:
- 该对话框应关闭并替换为以下消息: 找到并删除1个重复值;剩下7个独特的价值。
- 包含副本的行 A.汤普森 记录将从数据库中删除
- 即使有两个部分匹配的记录 R. Hol t,因为并非所有字段都匹配 - 两个记录的学号不同--Excel认为它是唯一的数据记录
使用删除重复项查找和删除部分匹配的记录
一次检查一个字段
由于Excel仅删除与所选数据字段完全匹配的数据记录,因此查找所有部分匹配数据记录的最佳方法是一次仅删除一个字段的复选标记,如下面的步骤所示。
对名称,年龄或程序以外的所有字段匹配的记录的后续搜索将删除部分匹配记录的所有可能组合。
寻找部分匹配的记录
- 如有必要,单击数据表中包含数据的任何单元格
- 点击 数据 功能区上的选项卡。
- 点击 删除重复项 图标突出显示数据表中的所有数据并打开 删除重复项 对话框。
- 选择数据表的所有字段名称或列标题。
- 要查找和删除每个字段中没有匹配项的记录,请删除Excel要忽略的字段名称旁边的复选标记。
- 在本例中,单击旁边的复选框 学生卡 列标题删除复选标记。
- Excel现在只搜索和删除具有匹配数据的记录 姓 , 初始 ,和 程序 领域。
- 点击 好
- 该对话框应关闭并替换为以下消息: 找到并删除1个重复值;剩下6个独特的价值。
- 包含第二条记录的行 R.霍尔特 学生证 ST348-252 将从数据库中删除。
- 点击 好 关闭消息框
此时,示例数据表应该没有所有重复数据。