31 de agosto de 2012

Normalización de bases de datos

¿Qué es la normalización del fichero?

El proceso de normalización de la base de datos consiste en aplicar una serie de reglas y procesos que tabulan la información para que quede estandarizada.

Las bases de datos se normalizan para:
  •     Evitar la redundancia de los datos.
  •     Optimizar el funcionamiento de los filtros.
  •     Evitar problemas de actualización de los datos en las tablas.
  •     Proteger la integridad de los datos. 
 ¿Para qué me sirve normalizar mi fichero?

La calidad del fichero depende íntegramente de la calidad de los datos que contenga. Toda base de datos va sufriendo una pérdida de calidad en sus datos a medida que pasa el tiempo. Cada usuario ingresa datos con metodologías propias que llevan a repetir y referenciar información con diferentes nombres (por ejemplo, los nombres de las calles o los nombres de las instituciones).

Esto dificulta la tarea al momento de realizar filtros o agrupamientos por dichos campos. La normalización tiene como objetivo reducir al mínimo esta suciedad que se genera a través de algoritmos que analizan la base de datos y la depuran cruzándola con fuentes de información estandarizadas.
 Este proceso genera varios beneficios:
  •     Los datos geográficos quedan estandarizados. Cada calle, localidad y provincia es referenciada de la misma manera en todos los registros.
  •     Los nombres de las instituciones se cruzan con una base maestra cuyos domicilios y referencias geográficas ya están validados. Cada institución se almacena en cada registro con un único nombre, facilitando el filtrado y agrupamiento de los registros.
  •     La estandarización facilita el cruce de información con fuentes externas al sistema que pudieran enriquecer los indicadores para la toma de decisiones (datos censales, datos prescriptivos, información geográfica regional).

¿Cómo funciona?

El módulo de normalización es independiente de Sistema Elvis. Si usted ya cuenta con un software de fichero propio, puede integrar el módulo de normalización para estandarizar su fichero.

El módulo funciona con algoritmos orgánicos que van "aprendiendo" de su fichero y lo van depurando con mayor eficiencia a medida que pasa el tiempo. Cuanto más se lo usa, mejores son los resultados. El sistema cruza la información de su fichero con bases de datos maestras que ya se encuentran estandarizadas.

Entre las funciones que contiene se encuentran:
  • Inteligencia y autoaprendizaje de referencias geográficas.
  • Estandarización y limpieza de caracteres de todos los campos.
  • Codificación de todos los campos de domicilio.
  • Generación de CPAs.
  • Referencia geográfica por latitud y longitud de los puntos geográficos con mayor actividad.
  • Cruce con datos poblacionales.
  • Representación geográfica sobre mapas.
  • Detección y compactación de duplicaciones.
  • Estandarización de matrículas profesionales.
  • Detección de emails o teléfonos inválidos.
  • Estandarización de nombres de instituciones.
Haga click aquí para conocer más detalle sobre la normalización de bases de datos en Sistema Elvis