Aquí tes unha pregunta típica de análise de datos que recibimos de cando en vez:
Teño unha folla de cálculo con máis de 100.000 filas de folla de cálculo de Excel que ten unha morea de información sobre os clientes que necesito limpar por duplicados. Estimaría que me levará uns días fregar a lista manualmente. Un colega díxome que probablemente necesitarei unha macro de Excel para facelo. O noso tipo de informática, que está familiarizado co desenvolvemento de Macro, está de baixa, polo que teño que resolvelo pola miña conta. Hai algunha maneira de resolver este problema sen saber como programar?
Si, hai unha forma de resolver isto en Excel, e non será necesario ser competente coa programación de Visual Basic. Imos adiante e resolvemos isto moi rápido para ti.
Eliminar filas duplicadas de Excel
Aquí tes como desfacerse das entradas innecesarias da túa folla de cálculo:
	- En primeiro lugar, fai unha copia do teu caderno de traballo, para que teñas unha copia de seguridade por se hai algún problema.
- A continuación, abra a súa folla de cálculo de Excel.
- Na cinta superior, prema a pestana Datos .
- Agora vai adiante e selecciona o intervalo de datos que desexas limpar. Asegúrate de seleccionar as cabeceiras da táboa se tamén están dispoñibles.
- Na sección Ferramentas de datos prema o botón Eliminar duplicados .
- Agora, vai adiante e comproba a columna correspondente que che axudará a determinar se unha entrada da túa lista está duplicada. No noso caso, usando o noso conxunto de datos de demostración de Obxectivos de vendas, utilizaremos as 3 primeiras columnas para identificar as filas duplicadas.

	- Preme Aceptar .
- Amosarase unha mensaxe que detalla o número de entradas eliminadas e as gardadas na táboa.

	- Preme Aceptar e inspecciona o conxunto de datos modificado para ver a corrección.
- Se estás satisfeito co resultado, continúa e garda o teu ficheiro. En caso contrario, podes desfacer o teu cambio ( Editar >> Desfacer ).
Consellos avanzados:
	- Capacidade similar está dispoñible en Excel PowerQuery, que lle permite transformar conxuntos de datos máis grandes e significativos.
- Se estás familiarizado coa linguaxe Python, podes soltar facilmente as filas duplicadas dun conxunto de datos usando a biblioteca Pandas.
Goza da túa análise de datos 😉