Pregunta complicada sobre eliminar duplicados según criterios
Hola tengo un excel con mas de 1 millón de registros de los cuales quiero eliminar duplicados que van de "1 a n" dups copio un poco de los títulos de las columnas, describo entre paréntesis
id_sivila_datos_estudio
id_sivila_estudio_individual
Identificador_1 (apellido y nombre)
Identificador_2 (a veces nombre)
Tipo_Documento
Nro_Documento
nombre_patologia
Interpretacion_de_Resultado (puede ser confirmado o no confirmado)
fecha_toma_muestra
nombre_provincia_muestra
nombre_departamento_muestra
cod_depto_indec_muestra
nombre_localidad_muestra
cod_loc_indec_muestra
sexo...
año
Y 50 campos más
Lo que necesito es primer criterio dni si se repite entonces compara apeynombre (identificador1) y si la patología es igual (puede suceder que entre por unos síntomas y se le haga estudios de varias ej hantavirus, dengue, leptospirosis...), solo deje uno que sea de Interpretacion_de_Resultado: confirmado y borre los demás repetidos siempre que sean del mismo "año",
Para mi es muy complicado deducir la formula y me da igual que se pueda resolver con vb macro o formato condicional o con lo que sea (así sea en access, consultas, sql)
Nota: el dni se puede repetir por que aveces cargan con 00000000000 y puede haber mas de una persona con el mismo numero, por eso después comparo con el indentificador1 para evitar eso.
nota2: esto viene en access y por exportación pasa a excel para poder graficar y analizar los datos
nota3: esto lo tengo que hacer todos los lunes ya que se actualizan datos semanales todos los domingos y el buscar duplicados manualmente me vuelve loco con tantas filas
MUCHISIMAS GRACIAS