Mostrar el registro sencillo del ítem

dc.contributor.authorPérez, Juan Pablo
dc.contributor.authorAmón, Iván
dc.coverage.spatialSeccional Medellínspa
dc.date.accessioned2020-11-25T22:10:53Z
dc.date.available2020-11-25T22:10:53Z
dc.date.issued2013
dc.identifier.urihttp://hdl.handle.net/20.500.11912/6584
dc.description12 p.spa
dc.description.abstractBajo el nombre de Record Linkage se conoce al conflicto que se presenta en los datos cuando una misma entidad del mundo real aparece representada dos o más veces a través de una o varias bases de datos, en registros o tuplas con igual estructura, pero sin un identificador único y presentan diferencias en sus valores. En este artículo nos referiremos a esta problemática como detección de duplicados. Para la detección de duplicados existen múltiples herramientas que utilizan funciones de similitud en la realización de esta tarea. Es bien conocido que algunas funciones de similitud son más eficaces que otras dependiendo de la situación problemática que presenten los datos. Por ejemplo, q-grams realiza una mejor tarea de detección que la distancia de edición cuando se está en presencia de palabras en diferente orden. Asimismo, las diferentes herramientas pueden lograr diferentes grados de eficacia en la detección de duplicados dependiendo de varios factores. En este artículo se presentan los resultados de una evaluación realizada a la herramienta para detección de duplicados Fuzzy Lookup que viene incluida en el SSIS (Sql Server Integration Services) de Microsoft Sql Server 2008 R2. Los resultados muestran que su eficacia es variable dependiendo de la situación problemática que presenten los datos.spa
dc.format.mimetypeapplication/pdf
dc.language.isospa
dc.publisherUPBspa
dc.relation.ispartofRevista en Telecomunicaciones e Informáticaspa
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectCalidad de Datosspa
dc.subjectDetección de Duplicadosspa
dc.subjectFuzzy Lookupspa
dc.subjectRecord Linkagespa
dc.titleEvaluación de la eficacia de la detección de duplicados utilizando Sql Serverspa
dc.typearticlespa
dc.rights.accessRightsopenAccessspa
dc.type.hasVersionpublishedVersionspa
dc.description.sectionalMedellínspa
dc.identifier.instnameinstname:Universidad Pontificia Bolivarianaspa
dc.identifier.reponamereponame:Repositorio Institucional de la Universidad Pontificia Bolivarianaspa
dc.identifier.repourlrepourl:https://repository.unab.edu.co/


Ficheros en el ítem

Thumbnail
Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Attribution-NonCommercial-NoDerivatives 4.0 International
Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 International