Resumen
La detección de duplicados busca en una o más fuentes de datos aquellas entidades que debiendo ser únicas tienen representaciones distintas. Las funciones de similitud existentes en general tienen un costo computacional alto, por lo cual se han desarrollado técnicas y herramientas para mejorar la eficiencia computacional de este proceso. En este artículo se hace un compendio de técnicas y herramientas que buscan mejorar la eficiencia del proceso utilizando procesamiento paralelo.
Detección de duplicados; Procesamiento paralelo.