INTRODUCCIÓN A LOS CONCEPTOS DE BASE DE DATOS

INTRODUCCIÓN A LOS CONCEPTOS DE BASE DE DATOS

Retornar a la Pagina Principal

 

1.1  DEFINICION DE BASES DE DATOS

 Una base de datos es un conjunto autodescriptivo de registros integrados.

 Una base de datos es autodescriptiva: porque además de los datos fuente del usuario contiene también una descripción de su propia estructura. Tal descripción es conocida como diccionario de datos (o directorio de datos o metadatos).

 La autodescripción de una base de datos es importante porque promueve la independencia entre el programa y los datos, ya que hace posible determinar la estructura y el contenido de la base de datos examinando la misma.

 Si cambia la estructura de los datos en la base de datos (por ejemplo agregar un campo), solo se introduce el cambio al diccionario de datos.

 JERARQUIA DE LOS DATOS

 La jerarquía normal de los datos es: los bits conforman bytes o caracteres; los caracteres constituyen campos; los campos integran registros y los registros componen archivos.

 Una base de datos incluye archivos de datos del usuario y más. Como se menciona una base de datos contiene una descripción de sí misma en los metadatos. Una base de datos incluye índices que se usan para representar las relaciones entre los datos y para mejorar el desempeño de la base de datos. La base de datos contiene a veces la información de las aplicaciones que las utilizan. La ultima categoría de los datos se denomina metadatos de aplicación.

 Bits à Bytes o caracteres à Campos à Registros  à Archivos.

 Una base de datos contiene los siguientes tipos de datos:

 a)     Archivos de datos del usuario.

b)       Metadatos

c)        Índices

d)        Metadatos de aplicación

 

  

 1.2. OBJETIVOS DE LOS SISTEMAS DE BASES DE DATOS

 De los sistemas tradicionales de Archivos a las Bases de Datos.

 Los sistemas informáticos tradicionales han sido llamados sistemas orientados hacia proceso, debido a que en ellos se pone énfasis en los tratamientos que reciben los datos, los cuales se almacenan en archivos diseñados para una determinada aplicación. Las aplicaciones se analizan e implantan con entera independencia unas de otras, y los datos no se suelen transferir entre ellas, sino  que se duplican siempre que los trabajos correspondientes los necesitan.

 Por lo cual, además de ocupación inútil de memoria secundaria, un aumento de los tiempos de proceso, al repetirse los mismos controles y operaciones en los distintos archivos. Pero más grave son las inconsistencias que a menudo se presentan en estos sistemas, debido a que la actualización de los mismos datos, cuando se encuentran en mas de un archivo, no se suele realizar de forma simultanea en todos los archivos.

 Por otra parte, la dependencia de los datos respecto al soporte físico y a los programas de lugar a una falta de flexibilidad y de adaptabilidad frente a los cambios que repercute muy negativamente en el rendimiento de conjunto del sistema informático.

 De esto, se puede deducir claramente la necesidad de una gestión más racional del conjunto de datos, surgiendo así un nuevo enfoque que se apoya sobre una base de datos en la cual los datos son recogidos y almacenados una sola vez, con independencia de los tratamientos.

 Por lo tanto, se ve la solución de los problemas asociados al tratamiento de los datos en los sistemas tradicionales lleva a un cambio en el enfoque del sistema de información, en el cual los datos se organizan y mantienen en un conjunto estructurado que no esta diseñado para una aplicación concreta, sino que, por el  contrario, tiende a satisfacer las necesidades de información de toda la organización.

 Estos sistemas orientados  hacia los datos van sustituyendo a los sistemas orientados al proceso, que por poca fiabilidad, falta de adecuación a la realidad y mal asegurada confidencialidad han ido perdiendo la confianza de los usuarios.

 Ventajas de las Bases de Datos Frente a los Archivos Clásicos.

 Las bases de datos, surgidas como respuesta al nuevo planteamiento de los sistemas orientados hacia los datos, para mejorar la calidad de las prestaciones de los sistemas informáticos y aumentar su rendimiento, presentan una multitud de ventajas frente a los sistemas clásicos de archivos.

 Las ventajas son:

  a)     Independencia de los datos respecto a los tratamientos y viceversa.

La mutua independencia de los datos y tratamiento lleva a que un cambio de estos últimos no imponga un nuevo diseño lógico y/o físico de la base de datos. Por otra parte, la inclusión de nuevas informaciones, desaparición de otras, cambios en la estructura física o en los cambios de acceso, no deben obligar a alterar los programas. Esta independencia de los tratamientos frente a la estructura de la base de datos, supone una considerable ventaja, al evitar esfuerzo que origina la reprogramación de las aplicaciones cuando se producen cambios en los datos.

 La flexibilidad que proporciona la independencia de los datos y programas es muy importante para conseguir sin excesivos costos la continua adaptación del sistema de información a la evolución de las organizaciones.

  b)     Coherencia de los Resultados

 Debido a que la base de datos se recoge y almacena una sola vez, en todos los tratamientos se utilizan los mismos datos, por lo  que los resultados de todos ellos son coherentes y perfectamente comparable.

 Además, al no existir  la redundancia en los datos, desaparece el problema que se presentaba en el enfoque clásico, de que el cambio de un dato obligaba a actualizar una serie de archivos. De esta forma se elimina también el inconveniente de las divergencias en los resultados  debidas a actualizaciones no simultaneas en todos los archivos.

  c)     Mejor disponibilidad de los datos para el conjunto de los usuarios.

 Cuando se aplica la metodología  de base de datos, cada usuario ya no es propietario de los datos, puesto que estos se comparten entre el conjunto de aplicaciones, existiendo una mejor disponibilidad de los datos para todos los que tienen necesidad de ellos, siempre que estén autorizados para su acceso.

 Hay también una mayor transparencia respecto a la información existente, que todos los datos que se encuentran en la base de datos se deben relacionar en un catalogo  o diccionario, que puede ser ampliamente difundido y accedido por medios informáticos.

  d)     Mayor Valor Informativo

 Puesto que la base de datos en un sistema reflejo del mundo real, donde los distintos elementos están interrelacionados, el valor informativo de su conjunto es superior a la suma del valor informativo de los elementos individuales que los constituyen.

 e)     Mejor y más normalizada documentación de la información, la cual esta integrada con los datos.

 En el enfoque clásico los datos se encuentran separados de su contenido semántico, los primeros se almacenan en los archivos y su descripción se hace mediante un lenguaje de programación. La documentación de los datos, realizada por el analista o programador, es en general insuficiente y a veces incluso inexistente.

   f)       Mayor eficiencia en la recolección, validación y entrada de los datos al sistema

 Al no existir apenas redundancias, los datos se recogen y validan una sola vez, aumentando así el rendimiento de todo el proceso previo al almacenamiento.

  g)     Reducción del espacio de almacenamiento

 La desaparición de las redundancias, así como la aplicación de técnicas de comparación, lleva en los sistemas de base de datos a una menor ocupación de almacenamiento secundario.

 Mantener información de la organización en un sistema de procesamiento de archivos tiene una serie de inconvenientes. Los propósitos de los sistemas de bases de datos son eliminar los siguientes inconvenientes:

 ·         Redundancia e inconsistencia de datos.- Debido a que los archivos de aplicación son creados por diferentes programadores en un largo periodo de tiempo, los diversos archivos tienen probablemente diferentes formatos y los programas pueden estar escritos en diferentes lenguajes. Mas aun la información puede estar duplicada en diferentes archivos.

 ·  Dificultad en el acceso a los datos.- Supóngase  que uno de los empleados de un banco necesita averiguar los nombres de todos los clientes  que viven en el distrito postal 28733 de la ciudad. El empleado pide al departamento del procesamiento de datos que genere dicha lista. Debido a que esta petición no fue prevista cuando el sistema original fue diseñado, no hay un programa de aplicación a mano para satisfacerla. Hay, sin embargo, un programa de aplicación que genera la lista de todos los clientes. El empleado del banco tiene 2 opciones: bien obtener la lista de todos los clientes y obtener la información que necesita manualmente, o bien pedir al departamento de procesamiento de datos que haga que un programador de sistemas escriba el programa de aplicación necesario.

 ·         Aislamiento de datos.- Debido a que los datos están dispersos en varios archivos, y los archivos pueden estar en diferentes formatos, es difícil escribir nuevos programas de aplicación para recuperar los datos apropiados.

 ·         Problemas de integridad.- Los valores de los datos almacenados en la base de datos deben satisfacer ciertos tipos de ligaduras de consistencia. Por ejemplo, el saldo de una cuenta bancario no debe ser menor de cierta cantidad. Los desarrolladores hacen cumplir esas ligaduras en el sistema añadiendo el código apropiado en los diversos programas de aplicación. Sin embargo, cuando añaden nuevas ligaduras, es difícil cambiar los programas para hacer que se cumplan. El problema es complicado cuando las ligaduras implican diferentes elementos de datos de diferentes archivos.

 ·         Problemas de Atomicidad.- Un sistema de una computadora, como cualquier otro dispositivo mecánico o eléctrico, esta sujeto a fallo. En muchas aplicaciones es crucial asegurar que una vez que un fallo ha ocurrido y se ha detectado, los datos se restauran  al estado de consistencia que existía antes del fallo.

 ·         Anomalías en el acceso concurrente.- Conforme se han ido mejorando el conjunto de ejecución de los sistemas y ha sido posible una respuesta en tiempo más rápida, muchos sistemas han ido permitiendo a múltiples usuarios actualizar los datos simultáneamente. En tales sistemas un entorno de interacción de actualizaciones concurrentes puede dar  lugar a datos inconsistentes.

 ·         Problemas de seguridad.- No todos los usuarios de un sistema de base de datos deberían poder acceder a todos los datos. Por ejemplo en un sistema bancario, el personal de nomina a necesita ver solo esa parte de la base de datos que tiene información acerca de varios empleados del banco. No necesitan acceder a la información acerca de las cuentas de los clientes.

  1.3 . ABSTRACCIÓN DE LA INFORMACIÓN

 Para que un sistema sea útil, debe recuperar los datos eficientemente. Esto ha conducido al diseño de estructura de datos complejas para la representación de los datos en la base de datos. Como muchos usuarios de base de datos no están familiarizados con computadoras, los desarrolladores esconden la complejidad a los usuarios a través de varios niveles de abstracción para simplificar la interacción de los usuarios con el sistema:

 Nivel Físico.- El nivel  mas bajo de abstracción describe como se almacenan realmente los datos. El nivel físico se describen en detalle las estructuras de datos complejas de bajo nivel.

 Nivel Lógico.- El siguiente nivel mas alto de abstracción describe que datos se almacenan en la base de datos y que relaciones existen entre esos datos. La base de datos completa se describe así en términos de numero pequeño de estructuras relativamente simples. Aunque la implementación de estructuras simples en el nivel lógico puede involucrar estructuras complejas del nivel físico, los usuarios del nivel lógico no necesitan preocuparse de esta complejidad. Los administradores de base de datos, que deben decidir la información que se mantiene en la base de datos, usan el nivel lógico de abstracción.

 Nivel de Vistas.- El nivel mas alto de abstracción describe solo parte de la base de datos completa. A pesar del uso de estructuras más simples en el nivel lógico, queda algo de complejidad, debido al gran tamaño de la base de datos. A muchos usuarios del sistema de base de datos nos les preocupará toda esa información. En su lugar solo necesitan acceder solo una parte de la base de datos. Para que su interacción con el sistema se simplifique, se define la abstracción del nivel de vistas. Dicho sistema  puede proporcionar muchas vistas para la misma base de datos. Niveles de Abstracción

  

 

  

Subir Arriba