Cómo eliminar entradas duplicadas en Excel utilizando 5 métodos eficaces
Gestionar duplicados en Excel es una de esas pequeñas frustraciones que pueden dificultar enormemente el análisis de datos, sobre todo si se trabaja con grandes registros de ventas, exportaciones de CRM o listas importadas. A veces, basta con eliminar rápidamente varios duplicados; otras veces, conviene resaltarlos y revisarlos antes de borrarlos. Por suerte, existen varias maneras de abordar este problema, desde herramientas integradas sencillas hasta soluciones automatizadas más avanzadas. El objetivo es limpiar los datos de forma eficiente, sin perder información importante y, a ser posible, reduciendo el trabajo manual.
Todas tienen sus ventajas y desventajas. Algunas son instantáneas pero permanentes, como la función integrada Eliminar duplicados, mientras que otras son más flexibles, como el formato condicional o Power Query, que permiten revisar los datos antes de actuar. Elegir el método adecuado depende de la frecuencia con la que se gestionan los duplicados, el tamaño del conjunto de datos y si se busca una solución rápida o un proceso automatizado y continuo.
Cómo corregir duplicados en Excel
Método 1: Herramienta integrada para eliminar duplicados
Prepara tus datos
- Primero, haga clic en cualquier celda o seleccione todo el conjunto de datos (Ctrl+A funciona si la tabla es contigua).Asegúrese de que la primera fila de sus datos tenga encabezados, ya que Excel los utiliza para identificar las columnas en el cuadro de diálogo.¿No hay encabezados? Es mejor agregarlos mediante Insertar > Fila de encabezado.
Acceda a la herramienta
- Dirígete a la pestaña Datos en la cinta de opciones, busca el grupo Herramientas de datos y haz clic en Eliminar duplicados. Aparecerá una ventana emergente con todas las columnas afectadas. Si los encabezados están configurados correctamente, verás casillas de verificación junto al nombre de cada columna.
Seleccione las columnas que desea revisar.
- Marque las casillas de las columnas donde los duplicados sean importantes (como Correo electrónico o ID de cliente ).Desmarque las irrelevantes; de lo contrario, Excel podría marcar duplicados falsos, especialmente con notas o comentarios de formato libre. Si su conjunto de datos no tiene encabezados, Excel trata la primera fila como datos, lo que puede causar problemas. Solucione esto agregando encabezados antes de ejecutar la herramienta.
Ejecutar y verificar
- Haz clic en Aceptar. Excel escaneará rápidamente y te indicará cuántos duplicados encontró y eliminó. Los borrará permanentemente del rango, así que es recomendable guardar una copia de seguridad antes de ejecutar este proceso.
Después, desplázate por la pantalla o aplica filtros para asegurarte de que todo esté correcto. Ordenar por columnas clave puede ayudarte a confirmar que no se hayan pasado por alto duplicados. Recuerda, ten cuidado: una vez que sobrescribas el original, deshacer los cambios no será sencillo a menos que tengas una copia de seguridad intacta.
Ventajas : Es rápido, funciona con conjuntos de datos enormes sin problemas y no requiere fórmulas.Desventajas : Es irreversible: las filas se pierden para siempre a menos que tengas una copia de seguridad. No distingue entre mayúsculas y minúsculas para los duplicados, ignora los espacios adicionales y no muestra qué se eliminará de antemano.
Atajos de teclado :
- Windows:Alt + A + M
- Impermeable:Command + Shift + %
Método 2: Resaltar con formato condicional
Esta herramienta es muy útil para detectar duplicados sin perder información. Simplemente los resalta visualmente para que puedas revisarlos, decidir y luego eliminarlos o filtrarlos manualmente. Resulta especialmente útil para realizar comprobaciones puntuales antes de una limpieza exhaustiva.
Pasos para resaltar duplicados
- Seleccione el rango : Resalte la columna o el conjunto de datos (por ejemplo, A2:A1000).Para comprobar varias columnas, seleccione todas las columnas relevantes o la tabla completa.
- Ve a la pestaña Inicio : Busca y haz clic en Formato condicional en el grupo Estilos.
- Seleccione Reglas para resaltar celdas > Valores duplicados : Elija un estilo de color (el relleno rojo es común, pero puede personalizarlo a su gusto) y pulse Aceptar. Los duplicados aparecerán inmediatamente, lo que facilita su revisión.
- Ajustar o eliminar resaltados : Utilice Formato condicional > Administrar reglas si desea modificar el color o eliminar la regla por completo. Si hay duplicados sospechosos, puede filtrar por color para aislarlos.
En algunos conjuntos de datos, te resultará muy útil, no solo para detectar duplicados, sino también para identificar patrones o valores atípicos. Ten en cuenta que esta función es solo visual; si quieres eliminar duplicados, tendrás que filtrarlos manualmente o usar la herramienta integrada.
Consejo: Para resaltar texto que distingue entre mayúsculas y minúsculas, puede ajustar la regla con fórmulas como la que se muestra =COUNTIF($A$2:$A$1000, A2)>1combinada con la opción DISTINGUIR MAYÚSCULAS Y MINÚSCULAS en Power Query o usar fórmulas personalizadas.
Ventajas : Funciona de forma dinámica, no modifica los datos inmediatamente, ideal para revisiones.Desventajas : Aún es necesario eliminar o filtrar manualmente los duplicados posteriormente; el rendimiento puede verse afectado con conjuntos de datos grandes.
Atajos de teclado :
- Windows:Alt + H + L + D
Método 3: Filtro avanzado solo para registros únicos
Si quieres crear una lista depurada sin modificar la original, esta es la solución ideal. Copia solo los registros únicos a otra ubicación, lo cual es perfecto para generar informes o listas nuevas.
Pasos para un filtro único
- Prepara tus datos : asegúrate de que los encabezados estén correctos, selecciona todo el rango de datos o haz clic dentro de él.
- Vaya a Datos > Avanzado : En el grupo Ordenar y filtrar, haga clic en Avanzado.
- Configure el cuadro de diálogo : seleccione “Copiar a otra ubicación” en Acción, especifique el *rango de la lista* (sus datos) y la celda donde desea que comience la lista (por ejemplo, F1).Marque la casilla para Solo registros únicos.
- Pulse Aceptar : Los elementos únicos se pegarán en el área especificada, listos para su posterior revisión o uso.
Este método resulta ideal cuando se necesita conservar los datos originales y simplemente extraer una lista limpia. Además, permite la coincidencia de varias columnas si se establecen los criterios correctamente.
Consejo práctico: Borre primero los subtotales o los esquemas (a través de Datos > Esquema > Borrar esquema ) para facilitar el trabajo del filtro. Asignar un nombre al rango de resultados con Fórmulas > Administrador de nombres también resulta útil si desea reutilizar la lista posteriormente en fórmulas o paneles.
Ventajas : Seguro, no destructivo, flexible en escenarios de varias columnas.Desventajas : Configuración manual cada vez; no hay actualización automática a menos que se repita el proceso.
Atajos de teclado :
- Windows:Alt + D + F + A
Método 4: Uso de fórmulas para la deduplicación dinámica
Aquí es donde se pone interesante: usar fórmulas como COUNTIFy UNIQUE. De esta forma, tu lista se actualiza automáticamente a medida que cambian los datos, lo cual es perfecto si estás manejando registros continuos u hojas de transacciones.
Fórmulas principales involucradas
- Para marcar duplicados : agregue una columna auxiliar y escriba
=COUNTIF($A$2:$A$1000, A2)>1. Arrástrela hacia abajo; TRUE indica repeticiones. - Para extraer entradas únicas : Úselo
=UNIQUE(A2:A1000)en una columna u hoja libre; mostrará la lista de todas las entradas únicas, actualizándose en tiempo real.
Para duplicados de varias columnas, primero combine las columnas: =A2&"|"+B2además, cuente con esa concatenación, o utilice =TEXTJOIN("", TRUE, A2:C2)para uniones más limpias. Luego, cuente con esas claves combinadas.
¿Solo quieres filtrar los valores únicos? Aplica un filtro o formato condicional a la columna auxiliar y, a continuación, copia las filas únicas visibles en otro lugar.
Atención: las versiones antiguas de Excel sin UNIQUEnecesitarán fórmulas de matriz como FREQUENCYo SUMPRODUCT, lo que puede resultar engorroso. Pero para las versiones más recientes, es pan comido.
Ventajas : Totalmente dinámico, ideal para conjuntos de datos en constante evolución.Desventajas : Las columnas auxiliares pueden saturarse; las fórmulas recursivas ralentizan las hojas de cálculo muy grandes.
Atajos de teclado :
- Para fórmulas de matriz en versiones antiguas de Excel:Ctrl + Shift + Enter
Método 5: Power Query – Automatizar la eliminación de duplicados
Si la limpieza repetitiva te resulta tediosa, Power Query podría convertirse en tu mejor aliado. Es como tener un mini proceso ETL integrado en Excel: carga los datos, límpialos y actualízalos cada vez que lleguen nuevos datos. Ideal para tareas recurrentes como informes mensuales o la sincronización de varias hojas de cálculo.
Breve resumen de cómo configurarlo
- Formato de tabla : Seleccione sus datos sin formato y, a continuación, pulse Insertar > Tabla (o Ctrl+T).Confirme que los encabezados sean correctos.
- Abra el Editor de Power Query : diríjase a Datos > Obtener y transformar datos > Desde tabla/rango.
- Eliminar duplicados : En el editor, seleccione las columnas que presenten duplicados (Ctrl+clic para seleccionar varias) y, a continuación, vaya a Inicio > Eliminar filas > Eliminar duplicados. Ahora solo verá filas únicas.
- Refina según sea necesario : utiliza las herramientas de transformación para limpiar los datos, como eliminar espacios, cambiar mayúsculas y minúsculas o filtrar.
- Para cargar la lista en Excel, haga clic en Cerrar y cargar. Su lista, sin duplicados, aparecerá en una hoja nueva.
Este método es práctico porque se actualiza automáticamente: basta con hacer clic con el botón derecho en la tabla de resultados y seleccionar » Actualizar» cuando se actualicen los datos sin procesar. Además, puede procesar millones de filas sin problemas, lo que lo hace ideal para grandes conjuntos de datos o paneles de control empresariales automatizados.
En algunos casos, la interfaz requiere un poco de tiempo para familiarizarse con ella, pero una vez configurada, facilita enormemente la limpieza de datos. Eso sí, ten en cuenta que la configuración inicial es algo más compleja y puede parecer excesiva para tareas pequeñas.
Mejores prácticas y solución de problemas
- Siempre haz una copia de seguridad antes de realizar limpiezas importantes; la función de deshacer de Excel no guarda los cambios después de guardar el archivo. Duplicar la hoja de cálculo es una forma rápida de mantener el original a salvo.
- Primero, normaliza tus datos de texto: usa TRIM para eliminar espacios adicionales, CLEAN para eliminar caracteres no imprimibles y UPPER/LOWER/PROPER para hacer coincidir mayúsculas y minúsculas si es necesario. Estos ajustes te ahorrarán muchos problemas.
- Ordene sus datos por columnas clave antes de eliminar los duplicados; esto mantiene en orden las entradas más recientes o más antiguas, lo que facilita la revisión manual.
- Realice pruebas primero con muestras pequeñas, especialmente cuando utilice fórmulas o Power Query, para evitar sorpresas.
- Para duplicados de varias columnas, considere concatenar las columnas (
=A2&B2) con un delimitador en una columna auxiliar. Esto ayuda a las herramientas a reconocer duplicados complejos. - Con problemas de distinción entre mayúsculas y minúsculas, utilice fórmulas como
=EXACT($A$2, $A2)o en Power Query, active la opción «Distinguir mayúsculas y minúsculas» en las opciones de combinación. - Si los filtros o subtotales interfieren, bórrelos primero: Datos > Esquema > Borrar esquema o Subtotal > Eliminar todo.
- Para conjuntos de datos realmente grandes, divídalos en fragmentos (menos de 100 000 filas) para un procesamiento rápido o utilice Power Query para cargas masivas.
Resumen
Eliminar duplicados de forma eficaz ahorra tiempo y garantiza la fiabilidad de tus datos. Tanto si utilizas la sencilla herramienta integrada, como si prefieres resaltarlos primero o usar Power Query o fórmulas, hay una opción que se adapta a tu flujo de trabajo. A menudo, empezar con una copia de seguridad y limpiar los datos facilita mucho las cosas.
Resumen
- Realice una copia de seguridad de sus hojas de cálculo antes de eliminarlas en masa.
- Elija el método adecuado en función del tamaño del conjunto de datos y las necesidades de edición.
- Normaliza el texto para evitar duplicados falsos.
- Si va a probar nuevos métodos, realice pruebas con muestras más pequeñas.
- Actualice periódicamente la configuración de Power Query para el trabajo en curso.