• No results found

Chapter 1 Introduction

4.3 Parallel edge addition algorithm

El análisis de los datos mediante el perfil de los mismos muestra datos capaces de revelarnos algunos posibles errores que existen en las bases de datos. Según los resultados obtenidos del reporte realizado sobre las bases de datos del Departamento de Economía y de Recursos Humanos por el perfil de los datos fueron corroborados algunos de los criterios que se tenía a priori, uno de ellos fue que muchos de los errores detectados se deben a errores de diseño de la base de datos y a la no utilización de las restricciones de integridad, a las que el modelo relacional da tanta importancia. Analicemos ahora con más detalles los posibles errores encontrados.

Base de datos de Recursos Humanos.

Errores relativos al diseño de la base de datos:

La base de datos de Recursos Humanos contiene un total de 166 tablas de las cuales 47 se encuentran vacías y 20 contienen menos de tres registros lo que constituye un tipo de error que revela problemas de diseño de la base de datos. El mal diseño está dado generalmente que las personas que lo realizan no son especialistas del tema y construyen tablas pensando en una futura utilización y que en realidad no son necesarias o crean tablas con resultados de un reporte que se llenará temporalmente en un momento dado y que pudiera ser sustituida por una consulta.

Existen dos tablas con un campo vacío y dos con cuatro campos vacíos lo cual constituye también, un problema de diseño.

Errores por la utilización de valor por defecto como valor ausente:

En la base de datos existen 16 tablas que tienen campos con valores por defecto que representan ausencia de valor, en particular la utilización de valores por defecto como el cero y la cadena vacía en lugar del uso del Null para indicar la ausencia del dato. Por ejemplo, en campos de tipo entero se registraron seis tablas que utilizaban el cero como valor por defecto y en una de ellas existía siete campos con este problema. Se hallaron 15 tablas con campos de tipo moneda con todos sus datos ceros, de ellas cuatro con nueve campos en iguales condiciones, y una con 24 campos y con 7333 registros. Además se detectaron dos tablas con un campo y una con diez campos de tipo cadena con todos sus datos igual a la cadena vacía, todas con más de 10412 registros.

Errores de información incorrecta entrada al sistema:

Existe una tabla Empeado_Gral que contiene información de los trabajadores del centro, la misma contiene un campo denominado Nombre_Madre, campo que tiene 4503 datos igual a la cadena vacía y presenta datos que no representan nombres tales como:

Cadena: '-' Número de ocurrencias: 348 Cadena: 'A' Número de ocurrencias: 15 Cadena: 'AA' Número de ocurrencias: 25 Cadena: 'AB' Número de ocurrencias: 1 Cadena: 'b' Número de ocurrencias: 1 Cadena: '`A' Número de ocurrencias: 1 Cadena: 'a' Número de ocurrencias: 1

Estos datos indican error de información incorrecta entrada al sistema, es el error que se comete en el proceso de entrada, por errores tipográficos u de otro tipo. Este tipo de error de igual forma fue descubierto en la misma tabla con el campo

Nombre_Padre el cual contiene 4514 cadenas vacías y cadenas presentadas de la forma siguiente:

Cadena: '_' Número de ocurrencias: 1 Cadena: '____' Número de ocurrencias: 1 Cadena: '-' Número de ocurrencias: 39 Cadena: '- -' Número de ocurrencias: 11 Cadena: '--' Número de ocurrencias: 11 Cadena: '---' Número de ocurrencias: 7 Cadena: '----' Número de ocurrencias: 23 Cadena: ' ----' Número de ocurrencias: 15 Cadena: ' --' Número de ocurrencias: 1 Cadena: 'G' Número de ocurrencias: 6 Cadena: 'E' Número de ocurrencias: 8 Cadena: 'A' Número de ocurrencias: 3 Cadena: 'AA' Número de ocurrencias: 2

La tabla Empleado_Gral tiene un campo Teléfono cuyo atributo contiene 10188 cadenas vacías, dato no muy relevante puesto que no todo trabajador tiene un teléfono pero a su vez puede que sea un error puesto que de 10412 empleados solo 224 lo tienen. Este campo además tiene errores de entrada al sistema ya que existen cadenas tales como ‘.’ y ‘0’ repetidas dos veces en el conjunto de datos y que no indican un número telefónico.

Existe una tabla RH_Expedientes_Deducciones que tiene un campo Nombre, el cual contiene cadenas con números delante, un campo Dirección con cadenas como ‘0.0’, ’59.’, ’62.’, y un campo Nota con cadenas iguales a ‘.’, ‘0’, ’00’, lo que representa un error. Existe además la tabla RH_Generales_Reporte_Ajustes con la cadena vacía en 69 registros y con la cadena ‘101 ’ en seis registros del campo Id_User.

Errores en la definición del tipo de campo:

En la tabla Empleado_Gral también existe un campo Estatura definido de tipo moneda cuando debe ser un campo de tipo real, con ello es detectado un error en la definición del tipo de campo. Además este campo presenta 10411 ceros de 10412 registros de la tabla.

Errores en el carné de identidad:

Otro campo detectado con errores fue el carné de identidad de la tabla Empleado_Gral, donde se encontraron carnés de longitud menor que 11 caracteres y 15 ocurrencias de la cadena vacía, además se pudo apreciar falta de restricciones en el diseño de la base de datos.

Otros errores:

En tabla Empeado_Gral existe un campo denominado AñosServicio cuyo campo presenta 7750 ceros de un total de 10412 registros, esto es un posible error ya que todo trabajador debe tener algún tiempo de servicio.

Base de datos del Departamento de Economía. Errores relativos al diseño de la base de datos:

Con el análisis realizado a la base de datos del Departamento de Economía de la UCLV se detectó 310 tablas que se encuentran vacías y 24 que tienen menos de cinco registros de un total de 456 tablas, este error está dado por el mal diseño de la base de datos.

Existen 29 tablas con campos vacíos entre ellas hay una con 27 campos, de 34 que presenta la tabla, que están vacíos; además hay una tabla con 13, una con 11 y dos con siete campos vacíos de más de 50 000 registros cada una, lo cual constituye también, un problema de diseño.

Errores por la utilización de valor por defecto como valor ausente:

Conjuntamente se hallaron varias tablas que tienen campos con valores por defecto que representan ausencia de valor. Se utilizan valores por defecto como el cero y el uno para campos de tipo entero y moneda, y la cadena vacía para campos de tipo

cadena en lugar del uso del Null para indicar la ausencia de valor. En la base de datos se detectaron 37 tablas con campos de tipo entero con todos sus datos ceros y 13 con sus valores igual a uno, se hallaron además 32 tablas con campos tipo moneda iguales a cero y cinco con valor uno, una de estas tablas contiene 39 campos con sus datos igual a cero y 25277 registros. Así mismo se encontraron 32 tablas con campos de tipo cadena con todos sus valores igual a la cadena vacía.

Errores de información incorrecta entrada al sistema:

Existe una tabla Empleado_Gral que contiene un campo Telefono que, al igual que en la base de datos de Recursos Humanos, presenta los mismos errores, datos como las cadenas ‘.’, ‘0’.’2’, que no representan un número telefónico. Esta tabla también contiene un campo Direccion que tiene datos como cadenas de números o un carácter, detectado como un error ya que en muestro país las direcciones están constituidas por más datos como el nombre del municipio, el de la provincia y en el caso que en la base de datos estos datos se almacenen como otro atributo el campo dirección debe contener la localidad, etc.

También se halla una tabla Recepcion con un campo Chofer y uno Pais que en sus datos tienen cadenas como ‘.’, ‘01’respectivamente, siendo los demás valores nombres.

Errores en el carné de identidad:

En el campo Nro_CI de la tabla Empleado_Gral se encontró un carné de identidad con longitud menor de 11 caracteres y 22 ocurrencias de la cadena vacía.

Otros tipos de errores:

Esta base de datos del departamento de Economía tiene una tabla denominada Acceso la que contiene un campo Id_User que almacena el nombre de usuario de los trabajadores del sistema. Este campo tiene datos tales como:

Cadena: '0001 ' Número de ocurrencias: 343 Cadena: '09 ' Número de ocurrencias: 305 Cadena: '1505 ' Número de ocurrencias: 343 Cadena: '50 ' Número de ocurrencias: 305

Cadena: '72081 ' Número de ocurrencias: 305 Cadena: '90 ' Número de ocurrencias: 305 Cadena: '94 ' Número de ocurrencias: 305

Estos datos son repetidos en 18 tablas de la base de datos y fueron seleccionados como posible error porque un nombre de usuario representa una persona, y una cadena de números no le da claridad al dato. Nos referimos a que un número no da idea de cual es la persona que hemos referenciado con él, lo que no indica que no sea posible utilizarlo con este objetivo.