martes, 15 de septiembre de 2009

LA NORMALIZACION DE UNA BASE DE DATOS


normalización:Normalización es un conjunto de reglas que sirven para ayudar a los diseñadores a desarrollar un esquema que minimice los problemas de lógica. Cada regla está basada en la que le antecede. La normalización se adoptó porque el viejo estilo de poner todos los datos en un solo lugar, como un archivo o una tabla de la base de datos, era ineficiente y conducía a errores de lógica cuando se trataba de manipular los datos. Por ejemplo, vea la base de datos MiTienda. Si almacena todos los datos en la tabla Clientes, ésta podría verse como se muestra a continuación: Clientes ID_Cliente Nombre Apellidos Nombre_Producto1 Costo_Producto1 Imagen_Producto1 Nombre_Producto2 Costo_Producto2 Imagen_Producto2 Fecha_Pedido Cantidad_Pedido Nombre_Cia_Envios La tabla se ha descrito de manera abreviada pero aun así representa la idea general. ¿Cómo podría añadir un nuevo cliente en su tabla Clientes? Debería añadir un producto y un pedido también. ¿Qué tal si quisiera emitir un informe de todos los productos que vende? No podría separar fácilmente los productos de los clientes con una simple instrucción SQL. Lo bello de las bases de datos relacionales, si están bien diseñadas, es que puede hacer esto fácilmente. La nomlalización también hace las cosas fáciles de entender. Los seres humanos tenemos la tendencia de simplificar las cosas al máximo. Lo hacemos con casi todo desde los animales hasta con los automóviles. Vemos una imagen de gran tamaño y la hacemos menos compleja agrupando cosas similares juntas. Las guías que la nomlalización provee crean el marco de referencia para simplificar la estructura. En su base de datos de muestra es fácil detectar que usted tiene tres diferentes grupos: clientes, productos y pedidos. Si sigue las guías de la nomlalización, podría crear las tablas basándose en estos grupos. El proceso de nomlalización tiene un nombre y una serie de reglas para cada fase. Esto puede parecer un poco confuso al principio, pero poco a poco irá entendiendo el proceso, así como las razones para hacerlo de esta manera. A la mayoría de la gente le encantan las hojas de cálculo por la forma en la que manejan sus datos. El tiempo que le lleve reconfigurar su esquema para ajustarlo al proceso de nomlalización, siempre será bien Iinvertido. Al fin y al cabo, esto le tomará menos tiempo que el que tendría que invertir , para cortar y pegar sus columnas de datos para generar el infomle que quiere su jefe. Otra ventaja de la nomlalización de su base de datos es el consumo de espacio. Una base de datos nomlalizada puede ocupar menos espacio en disco que una no nomlalizada. Hay menos repetición de datos, lo que tiene como consecuencia un mucho menor uso de espacio en disco. Grados de normalización Existen básicamente tres niveles de normalización: Primera Fomla Normal (1NF), Segunda Fomla Normal (2NF) y Tercera Fomla Normal (3NF). Cada una de estas formas tiene sus propias reglas. Cuando una base de datos se conforma a un nivel, se considera nomlalizada a esa forma de nomlalización. Por ejemplo, supongamos que su base de datos cumple con todas las reglas del segundo nivel de nomlalización. Se considera que está en la Segunda Fomla Normal. No siempre es una buena idea tener una base de datos conformada en el nivel más alto de normalización. Puede llevar aun nivel de complejidad que pudiera ser evitado si estuviera en un nivel más bajo de normalización. Primera Forma Normal La regla de la Primera Forma Normal establece que las columnas repetidas deben eliminarse y colocarse en tablas separadas. Ésta es una regla muy fácil de seguir. Observe el esquema de la tabla Clientes de la base de datos. . ClientesID Cliente NombreApellidos Nombre_Producto1Costo_Producto1 Imagen_Producto1 Nombre_Producto2 Costo_Producto2 Imagen_Producto2 Fecha_Pedido Cantidad_Pedido Nombre Cia Envios -- La tabla tiene varias columnas repetidas. Éstas se refieren principalmente a los productos. De acuerdo con la regla, debe eliminar las columnas repetidas y crearles su propia tabla. Eliminación de datos repetidos en una base de datos Clientes PedidosID_Clientes Nombre_ProductosNombre Costo_Producto Apellidos Imagen_Producto Direccion Numero_Pedido Fecha_Pedido Cantidad_Pedido Clave_Cia_EnviosNombre_Ci_ Envios -- Ahora tiene dos tablas. Pero todavía hay un problema. No hay forma de relacionar los datos de la tabla original con los de la nueva tabla. Para hacerlo, debe añadir un campo clave a la segunda tabla de forma que se establezca la relación. Añada a la tabla Productos una clave primaria que se llame ID_Producto y añada una clave a la tabla Clientes que la relacione con la tabla Productos. El campo ID_Producto es el candidato ideal.Primera Forma Normal Clientes PedidosID_Productos ID_ProductosID_Clientes Nombre_ProductosNombre Costo_Producto Apellidos Imagen_Producto Direccion Numero_Pedido Fecha_Pedido Cantidad_Pedido Clave_Cia_Envios-- Así, se ha establecido una relación uno a varios. Ésta representa lo que la base de datos estará haciendo en la vida real. El cliente tendrá muchos productos que podrá comprar, sin importar cuántos otros clientes quieran comprarlos también. Además, el cliente necesitará haber pedido un producto para ser un cliente. Usted ya no está obligado a añadir un cliente cada vez que añade un nuevo producto a su inventario. Poner la base de datos en la Primera Forma Normal resuelve el problema de los encabezados de columna múltiples. Muy a menudo, los diseñadores de bases de datos inexpertos harán algo similar a la tabla no normalizada. Una y otra vez, crearán columnas que representen los mismos datos. En una empresa de servicios de electricidad, había una base de datos para el control de refacciones de una planta nuclear. La tabla de su base de datos, la cual contenía los números de parte de las refacciones, tenía una columna repetida más de treinta veces. Cada vez que una nueva parte se tenía que dar de alta, se creaba una nueva columna para almacenar la información. Obviamente, el diseño de la base de datos era bastante pobre y, por lo mismo, resultaba una pesadilla para sus programadores/administradores. La normalización ayuda a clarificar la base de datos ya organizarla en partes más pequeñas y más fáciles de entender. En lugar de tener que entender una tabla gigantesca y monolítica que tiene muchos diferentes aspectos, usted sólo tiene que entender objetos pequeños y más tangibles, así como las relaciones que guardan con otros objetos también pequeños. No es necesario mencionar que un mejor entendimiento del funcionamiento de su base de datos conducirá aun mejor aprovechamiento de sus activos. Segunda Forma Normal La regla de la Segunda Forma Normal establece que todas las dependencias parciales se deben eliminar y separar dentro de sus propias tablas. Una depen dencia parcial es un término que describe a aquellos datos que no dependen de la clave de la tabla para identificarlos. En la base de datos de muestra, la información de pedidos está en cada uno de los registros. Sería mucho más simple utilizar únicamente el número del pedido. El resto de la información podría residir en su propia tabla. Una vez que haya organizado la información de pedidos.Eliminación de las dependencias parciales -Segunda Forma Normal Clientes Pedidos ProductosID_Productos ID_Productos ID_ProductoID_Clientes Nombre_Productos Fecha_CompraNombre Cantidad_Pedido Costos_ProductosApellidos Imagen_Producto Direccion Numero_Pedido Nombre_Cia_EnviosDe nuevo, al organizar el esquema de esta forma puede reflejar el mundo real en su base de datos. Tendría que hacer algunos cambios en sus reglas del negocio para que esto fuera aplicable, pero para ilustrar la normalización, así está bien. Una de las mayores desventajas de la normalización es el tiempo que lleva hacerlo. La mayoría de la gente está demasiado ocupada, y emplear tiempo para asegurarse de que sus datos están normalizados cuando todo funciona más o menos bien, parece ser un desperdicio de tiempo. Pero no es así. Usted tendrá que emplear más tiempo arreglando una base de datos no normalizada que el que emplearía en una normalizada. Al haber alcanzado la Segunda Forma Normal, usted puede disfrutar de algunas de las ventajas de las bases de datos relacionales. Por ejemplo, puede añadir nuevas columnas a la tabla Clientes sin afectar a las tablas Productos y Pedidos. Lo mismo aplica para las otras tablas. Alcanzar este nivel de normalización permite que los datos se acomoden de una manera natural dentro de los límites esperados. Una vez que ha alcanzado el nivel de la Segunda Forma Normal, se han controlado la mayoría de los problemas de lógica. Puede insertar un registro sin un exceso de datos en la mayoría de las tablas. Observando un poco más de cerca la tabla Clientes, vemos la columna Nombre_Cia_Envios. Ésta no es dependiente del cliente. El siguiente nivel de normalización explicará cómo solucionar esto. Tercera Forma Normal La regla de la Tercera Forma Normal señala que hay que eliminar y separar cualquier dato que no sea clave. El valor de esta columna debe depender de la clave. Todos los valores deben identificarse únicamente por la clave. En la base de datos de muestra, la tabla Clientes contiene la columna Nombre_Cia_Envios, la cual no se identifica únicamente por la clave. Podría separar estos datos de la tabla y ponerlos en una tabla aparte.Eliminación de los datos que no son claves para la Tercera Forma NormalClientes Productos PedidoMaestro PedidoDetallado Cias_EnviosID_cliente ID_Producto ID_Pedido ID_PedidoDetallado ID_Cia_EnviosID_Producto Nombre_Producto Fecha_Pedido ID_Pedido Nombre_Cia_Envios.Numero_Pedido Costos_Productos Cantidad_Pedidos Fecha_Pedido ID_Cia_Envios Foto_Producto Cantidad_PedidoNombreApellidosDireccionAhora todas sus tablas están en la Tercera Forma Normal. Esto le da más flexibilidad y previene errores de lógica cuando inserta o borra registros. Cada columna en la tabla está identificada de manera única por la clave, y no hay datos repetidos. Esto provee un esquema limpio y elegante, que es fácil de trabajar y expandir. Qué tan lejos debe llevar la normalización La siguiente decisión es ¿qué tan lejos debe llevar la normalización? La normalización es una ciencia subjetiva. Determinar las necesidades de simplificación depende de usted. Si su base de datos va a proveer información aun solo usuario para un propósito simple y existen pocas posibilidades de expansión, normalizar sus datos hasta la 3FN sea quizá algo extremoso. Las reglas de normalización existen como guías para crear tablas que sean fáciles de manejar, así como flexibles y eficientes. A veces puede ocurrir que normalizar sus datos hasta el nivel más alto no tenga sentido. Por ejemplo, suponga que añade una columna extra para la dirección en su base de datos. Es muy normal tener dos líneas para la dirección. El esquema de la tabla podría verse como se muestra a continuación: ID_ClienteNombreApellidosDireccion1Direccion2De acuerdo con las reglas, si aplica la Primera Forma Normal, la columna de dirección debería sacarse de esta tabla y reemplazarse con la clave de una nueva tabla. El resultado de este esquema se muestra a continuación: ID_Ciente ID_DireccionNombre ID_ClienteApellidos DireccionLa base de datos ahora cumple con la Primera Forma Normal. Los clientes pueden tener más de una dirección. El problema aquí es que usted ha complicado demasiado una idea simple, por tratar de seguir las reglas de normalización. En el ejemplo mostrado, la segunda dirección es totalmente opcional. Está ahí sólo para colectar información que pudiera utilizarse como información de contacto. No hay necesidad de partir la tabla en dos y forzar las reglas de la normalización. En esta instancia, el exceso de normalización frustra el propósito para el que se utilizan los datos. Añade, de manera innecesaria, un nivel más de complejidad. Una buena forma de determinar si está llevando demasiado lejos su normalización, es ver el número de tablas que tiene. Un número grande de tablas pudiera indicar que está normalizando demasiado. Observe su esquema.¿Está dividiendo tablas sólo para seguir las reglas o estas divisiones son en verdad prácticas? Éstas son el tipo de cosas que usted, el diseñador de la base de datos, necesita decidir. La experiencia y el sentido común lo pueden auxiliar para tomar la decisión correcta. La normalización no es una ciencia exacta. Es subjetiva. Existen seis niveles más de normalización que no se han discutido aquí. Ellos son Forma Normal Boyce-Codd, Cuarta Forma Normal (4NF), Quinta Forma Normal (5NF) o Forma Normal de Proyección-Unión, Forma Normal de Proyección-Unión Fuerte, Forma Normal de Proyección-Unión Extra Fuerte y Forma Normal de Clave de Dominio. Estas formas de normalización pueden llevar las cosas más allá de lo que necesita. Éstas existen para hacer una base de datos realmente relacional. Tienen que ver principalmente con dependencias múltiples y claves relacionales.En resumen La normalización es una técnica que se utiliza para crear relaciones lógicas apropiadas entre tablas de una base de datos. Ayuda a prevenir errores lógicos en la manipulación de datos. La normalización facilita también agregar nuevas columnas sin romper el esquema actual ni las relaciones. Existen varios niveles de normalización: Primera Forma Normal, Segunda Forma Normal, Tercera Forma Normal, Forma Normal Boyce-Codd, Cuarta Forma Normal, Quinta Forma Normal o Forma Normal de Proyección-Unión, Forma Normal de Proyección-Unión Fuerte, Forma Normal de Proyección-Unión Extra Fuerte y Forma Normal de Clave de Dominio. Cada nuevo nivel o forma lo acerca más a hacer su base de datos verdaderamente relacional. Se discutieron las primeras tres formas. Éstas proveen suficiente nivel de normalización para cumplir con las necesidades de la mayoría de las bases de datos. Normalizar demasiado puede conducir a tener una base de datos ineficiente y hacer a su esquema demasiado complejo para trabajar. Un balance apropiado de sentido común y práctico puede ayudarle a decidir cuándo normalizar.

BASES DE DATOS RELACIONALES


Base de datos relacionales
En una computadora existen diferentes formas de almacenar información. Esto da lugar a distintos modelos de organización de la base de datos: jerárquico, red, relacional y orientada a objeto.
Los sistemas relacionales son importantes porque ofrecen muchos tipos de procesos de datos, como: simplicidad y generalidad, facilidad de uso para el usuario final, períodos cortos de aprendizaje y las consultas de información se especifican de forma sencilla.
Las tablas son un medio de representar la información de una forma más compacta y es posible acceder a la información contenida en dos o más tablas. Más adelante explicaremos que son las tablas.
Las bases de datos relacionales están constituidas por una o más tablas que contienen la información ordenada de una forma organizada. Cumplen las siguientes leyes básicas:
Generalmente, contendrán muchas tablas.
Una tabla sólo contiene un número fijo de campos.
El nombre de los campos de una tabla es distinto.
Cada registro de la tabla es único.
El orden de los registros y de los campos no está determinados.
Para cada campo existe un conjunto de valores posible.

Diseño de las bases de datos relacionales
El primer paso para crear una base de datos, es planificar el tipo de información que se quiere almacenar en la misma, teniendo en cuenta dos aspectos: la información disponible y la información que necesitamos.
La planificación de la estructura de la base de datos, en particular de las tablas, es vital para la gestión efectiva de la misma. El diseño de la estructura de una tabla consiste en una descripción de cada uno de los campos que componen el registro y los valores o datos que contendrá cada uno de esos campos.
Los campos son los distintos tipos de datos que componen la tabla, por ejemplo: nombre, apellido, domicilio. La definición de un campo requiere: el nombre del campo, el tipo de campo, el ancho del campo, etc.
Los registros constituyen la información que va contenida en los campos de la tabla, por ejemplo: el nombre del paciente, el apellido del paciente y la dirección de este. Generalmente los diferente tipos de campos que su pueden almacenar son los siguientes: Texto (caracteres), Numérico (números), Fecha / Hora, Lógico (informaciones lógicas si/no, verdadero/falso, etc., imágenes.
En resumen, el principal aspecto a tener en cuenta durante el diseño de una tabla es determinar claramente los campos necesarios, definirlos en forma adecuada con un nombre especificando su tipo y su longitud.

relacion entre los datos


Relación Entre Los DatosSistema de administración de bases de datos, que almacena información en tablas (filas y columnas de datos) y realiza búsquedas utilizando los datos de columnas especificadas de una tabla para encontrar datos adicionales en otra tabla. En una base de datos relacional, las filas representan registros (conjunto de datos acerca de elementos separados) y las columnas representan campos (atributos particulares de un registro). Al realizar las búsquedas, una base de datos relacional hace coincidir la información de un campo de una tabla con información en el campo correspondiente de otra tabla y con ello produce una tercera tabla que combina los datos solicitados de ambas tablas. Por ejemplo si una tabla contiene los campos NÚM-EMPLEADO, APELLIDO, NOMBRE Y ANTIGÜEDAD y otra tabla contiene los campos DEPARTAMENTO, NÚM-EMPLEADO y SALARIOS, una base de datos relacional hace coincidir el campo NÜM-EMPLEADO de las dos tablas para encontrar información, como por ejemplo los nombres de los empleados que ganan un cierto salario o los departamentos de todos los empleados contratados a partir de un día determinado. En otras palabras, una base de datos relacional utiliza los valores coincidentes de dos tablas para relacionar información de ambas. Por lo general, los productos de base de datos para microcomputadoras o microordenadores son base de datos relaciónales.
Relación Muchos A UnoEjemplosPROY- GERENTE (los proyectos designan a los gerentes)DEPTO-EMP (los empleados designan a los departamento)EMP-DEPEN (los dependientes designan a los empleados)De estas tres, la última implica un tipo de entidad débil (DEPENDIENTE) y las otras dos implican sólo tipos de entidades regulares. El ejemplo DEPTO-EMP no provoca la introducción de relaciones nuevas. En vez de ello, basta introducir una clave ajena en la relación correspondiente al lado de "muchos" de la interrelación (EMP), que haga referencia a la relación correspondiente al lado "uno" (DEPTO).La interrelación entre un tipo de entidad débil y el tipo de entidad del cual depende es por su puesto una interrelación de muchos a uno.
Relación uno a unoNo son muy frecuentes en cualquier caso en prácticas. Estas se manejan exactamente en el mismo modo que las interrelaciones mucho a uno.
Relaciones mucho a muchoLas interrelaciones de muchos a muchos (o de muchos a muchos a muchos, etc) mostradas en el ejemplo siguiente:PROY-TRABAJO (asocia empleados y proyectos)PROV-PARTE (asocia proveedores y partes)PROV_PARTE_PROY (asocia proveedores, partes y proyectos)ESTRUCTURA DE PARTES (asocia a partes a partes)Cada una de estas interrelaciones también corresponde a una relación base. Por tanto, introducimos otras cuatro relaciones base correspondientes a estas cuatro interrelaciones. Como en el caso de las interrelaciones de muchos a muchos, resulta que podemos escoger. Una posibilidad es tomar la combinación de la clave ajena y la "clave" de la entidad del diagrama E/R. O bien, podríamos introducir un atributo nuevo no compuesto que sirva como clave primaria.
Enfoque jerarquizadoUna base de datos jerárquica se compone de un conjunto ordenado de árboles, dicho de manera más precisa, un conjunto ordenado formado por múltiples ocurrencias de un solo tipo de árbol.
ÁrbolesUn tipo de árbol consiste en un solo tipo de registro "raíz", junto con un conjunto ordenado de cero o más tipos de subárbol dependientes (de nivel más bajo). Un tipo de subárbol a su vez consiste en un solo tipo de registro la raíz del tipo de subárbol junto con un conjunto ordenado de cero o más tipos de subárbol dependientes, de nivel más bajo, y así sucesivamente. Por tanto, el tipo de árbol completo es un arreglo jerárquico de tipos de registro. Además, claro, los tipos de registro están formados por tipos de campo de la manera acostumbrada.Directorio raíz, en informática, punto de entrada en el árbol de directorios en una estructura jerárquica de directorios. Las ramificaciones de esta raíz son varios directorios y subdirectorios, cada uno de los cuales puede contener uno o más archivos y subdirectorios propios. En la ilustración se muestra una estructura de directorios del sistema operativo MS-DOS. El directorio raíz se identifica con la barra invertida (\) y constituye el directorio principal del disco duro. Por debajo de la raíz hay un directorio denominado MIS DOCUMENTOS, que contiene dos subdirectorios adicionales, CARTAS e INFORMES.
Árboles BinariosLos árboles de grado 2 tienen una especial importancia. Se le conoce con el nombre de Árboles binarios. Se define un árbol binario como un conjunto finito de elementos (nodos) que bien está vació o está formado por una raíz con dos árboles binarios disjuntos, llamados subárbol izquierdo y derecho de la raíz.En los apartados que siguen se consideran únicamente árboles binarios y, por lo tanto, se utilizará la palabra árbol para referirse a árbol binario. Los árboles de grado superior a 2 reciben el nombre de árboles multicamino.
Árbol binario de búsquedaLos árboles binarios se utilizan frecuentemente para representar conjuntos de datos cuyos elementos se identifican por una clave única. Si el árbol esta organizado de tal manera que la clave de cada nodo es mayor que todas las claves su subárbol izquierdo y menor que todas las claves del subárbol derecho se dice que este árbol es un árbol binario de búsqueda.

Operaciones básicasUna tarea muy común a realizar con un árbol es ejecutar una determinada operación con cada uno de los elementos del árbol. Esta operación se considera entonces como un parámetro de una tarea más general que es la visita de todos los nodos o, como se denomina usualmente, del recorrido del árbol.Si se considera la tarea como un proceso secuencial, entonces los nodos individuales se visitan en un orden especifico, y pueden considerarse como organizados según una estructura lineal. De hecho, se simplifica considerablemente la descripción de muchos algoritmos si puede hablarse del proceso del siguiente elemento en el árbol, según su cierto orden subyacente.Hay dos formas básicas de recorrer un árbol: El recorrido en amplitud y el recorrido en profundidad.
Recorrido En AmplitudEs aquel recorrido que recorre el árbol por niveles, en el último ejemplo sería:12 – 8,17 – 5,9,15.Recorrido en profundidad Recorre el árbol por subárboles. Hay tres formas: Preorden, orden central y postordenPREORDEN: Raíz, Subárbol izquierdo, subárbol derechoORDEN CENTRAL: Subárbol izquierdo, raíz, subárbol derechoPOST ORDEN: Subárbol izquierdo, subárbol derecho, raíz. Directorio raíz, en informática, punto de entrada en el árbol de directorios en una estructura jerárquica de directorios. Las ramificaciones de esta: raíz son varios directorios y subdirectorios, cada uno de los cuales puede contener uno o más archivos y subdirectorios propios. En la ilustración se muestra una estructura de directorios del sistema operativo MS-DOS. El directorio raíz se identifica con la barra invertida (\) y constituye el directorio principal del disco duro. Por debajo de la raíz hay un directorio denominado MIS DOCUMENTOS, que contiene dos subdirectorios adicionales, CARTAS e INFORMES.El camino es un elemento más inteligente y posibilita la interconexión de diferentes tipos de redes de ordenadores.Hoja de calculo, programa de aplicación utilizado normalmente en tareas de creación de presupuestos o previsiones, y en otras tareas financieras. En un programa de hoja de calculo, los datos y las formulas necesarios se introducen en formularios tabulares (hojas de cálculos u hojas de trabajo), y se utilizan para analizar, controlar, planificar o evaluar el impacto de los cambios reales o presupuesto sobre una estrategia económica. Los programas de hoja de cálculo usan filas columnas y celdas. Cada celda puede contener texto, datos numéricos o una formula que use valores existentes en otras celdas para hacer un cálculo determinado. Para facilitar los cálculos, estos programas incluyen funciones incorporadas que realizan operaciones estándar. Dependiendo del programa, una sola hoja de cálculo puede contener miles o millones de celdas. Algunos programas de hojas de cálculo permiten también vincular una hoja de cálculos a otra que contenga información relacionada y pueden actualizar de forma automática los datos de las hojas vinculadas. Los programas de hojas de cálculos pueden incluir también utilidades de macros; algunas se pueden utilizar para crear y ordenar bases de datos. Los programas de hoja de cálculo cuentan por lo general con capacidades gráficas para imprimir sus resultados. También proporcionan un buen número de opciones de formato tanto para las páginas y el texto impreso como para los valores numéricos y las leyendas de los gráficos.
Enfoque RelacionalCasi todos los productos de base de datos desarrollados años recientes se basan en lo que se conoce como enfoque relacional. La cuestión es que ningún sistema actual maneja el modelo relacional en todos sus aspectos (varios se acercan, pero la mayor parte fallan en algún detalle u otro; en los dominios, o si no en alguna otra cosa)Bases de datos relaciónales, es decir, bases de datos percibidas por el usuario como tablas y solo como tablas.En una computadora existen diferentes formas de almacenar información. Esto da lugar a distintos modelos de organización de la base de datos: jerárquico, red, relacional y orientada a objeto. Los sistema relacionales son importantes porque ofrecen tipos de procesos de datos, como: simplicidad y generalidad, facilidad de uso para el usuario final, períodos cortos de aprendizaje y las consultas de información se especifican de forma sencilla.Las tablas son un medio de representar la información de una forma más compacta y es posible acceder a la información contenida en dos o más tablas. Mas adelante explicaremos que son las tablas.Las bases de datos relacionales están constituidas por una o más tablas que contienen la información ordenada de una forma organizada. Cumplen las siguientes leyes básicas:
Generalmente, contendrá muchas tablas.
Una tabla sólo contiene un número fijo de campos.
El nombre de los campos de una tabla es distinto.
Cada registro y de la es único.
El orden de los registros y de los campos no está determinado
Para cada campo existe un conjunto de valores posible.
Requisitos Que Han De Tener Las Tablas El primer paso para crear una base de datos, es planificar el tipo de información que se quiere almacenar en la misma, teniendo en cuenta dos aspectos: la información disponible y la información que necesitamos.La planificación de la estructura de la base de datos, en particular de las tablas, es vital para la gestión efectiva de la misma. El diseño de la estructura de una tabla consiste en una descripción de cada uno de los campos que componen el registro y los valores o datos que contendrá cada uno de esos campos.Los campos son los distintos tipos de datos que componen la tabla, por ejemplo: nombre, apellido, domicilio. La definición de un campo requiere: el nombre del campo, el tipo de campo, el ancho del campo, etc.Los registros constituyen la información que va contenida en los campos de la tabla, por ejemplo: el nombre del paciente, el apellido del paciente y la dirección de este. Generalmente los diferentes tipos de campos que se pueden almacenar son los siguientes: texto (caracteres), Numérico (números), Fecha / Hora, Lógico (informaciones lógicas si / no, verdadero / falso, etc., imágenes.En resumen, el principal aspecto a tener en cuenta durante el diseño de una tabla es determinar claramente los campos necesarios, definirlos en forma adecuada con una nombre especificado su tipo y su longitud.Terminología Para Describir La Estructura Relacional.


· Relaciones: corresponde a lo que hasta ahora hemos llamado en general tabla
· Una tupla: corresponde a una fila de esa tabla y un atributo a una columna. El número de tuplas se denomina cardinalidad y el número de atributos se llama grado.
· Campo: columna es la vista lista que muestra una categoría de información como un número de serie o fecha de compra.
· Registro: toda la información relacionada sobre una persona, lugar o cosa.
· Ada, en informática, el lenguaje de programación basado en procedimientos diseñado bajo la dirección del Departamento de Defensa (DOD) de Estado Unidos a finales de la década de 1970. Ada, llamado así en honor a Augusta Ada Byron, condesa de Lovelace y pionera en el campo de la informática, se desarrolló a partir del Pascal, aunque incluía importantes extensiones semánticas y sintácticas, incluyendo la ejecución simultanea de tareas.
· La clave primaria: es única para las tablas, es decir, una columna o combinación de columnas con la siguiente propiedad. Nunca existen dos filas de la tabla con el mismo valor en esa columna o combinación de columnas.
Por último, un dominio es una colección de valores, de los cuales uno o más atributos (columnas) obtienen sus valores reales.

. Bases de Datos distribuidas
Son las Bases de Datos que no están almacenadas totalmente en un solo lugar físico, (esta segmentada) y se comunican por medio de enlaces de comunicaciones a través de una red de computadoras distribuidas geográficamente.
. Tendencias futuras
La explotación efectiva de la información dará ventaja competitiva a las organizaciones.
Las bases de datos orientadas a objetos empleadas para diseño y manufactura asistida por computadora CAD/CAM serán utilizados a un mismo nivel que las Bases se Datos relacionales de la actualidad.
Los lenguajes de consulta (SQL) permitirán el uso del lenguaje natural para solicitar información de la Base de Datos, haciendo más rápido y fácil su manejo.

RELACION ENTRE LOS DATOS

Sistema de administración de bases de datos, que almacena información en tablas (filas y columnas de datos) y realiza búsquedas utilizando los datos de columnas especificadas de una tabla para encontrar datos adicionales en otra tabla. En una base de datos relacional, las filas representan registros (conjunto de datos acerca de elementos separados) y las columnas representan campos (atributos particulares de un registro). Al realizar las búsquedas, una base de datos relacional hace coincidir la información de un campo de una tabla con información en el campo correspondiente de otra tabla y con ello produce una tercera tabla que combina los datos solicitados de ambas tablas. Por ejemplo si una tabla contiene los campos NÚM-EMPLEADO, APELLIDO, NOMBRE Y ANTIGÜEDAD y otra tabla contiene los campos DEPARTAMENTO, NÚM-EMPLEADO y SALARIOS, una base de datos relacional hace coincidir el campo NÜM-EMPLEADO de las dos tablas para encontrar información, como por ejemplo los nombres de los empleados que ganan un cierto salario o los departamentos de todos los empleados contratados a partir de un día determinado. En otras palabras, una base de datos relacional utiliza los valores coincidentes de dos tablas para relacionar información de ambas. Por lo general, los productos de base de datos para microcomputadoras o microordenadores son base de datos relaciónales.
Relación Muchos A UnoEjemplosPROY- GERENTE (los proyectos designan a los gerentes)DEPTO-EMP (los empleados designan a los departamento)EMP-DEPEN (los dependientes designan a los empleados)De estas tres, la última implica un tipo de entidad débil (DEPENDIENTE) y las otras dos implican sólo tipos de entidades regulares. El ejemplo DEPTO-EMP no provoca la introducción de relaciones nuevas. En vez de ello, basta introducir una clave ajena en la relación correspondiente al lado de "muchos" de la interrelación (EMP), que haga referencia a la relación correspondiente al lado "uno" (DEPTO).La interrelación entre un tipo de entidad débil y el tipo de entidad del cual depende es por su puesto una interrelación de muchos a uno.
Relación uno a unoNo son muy frecuentes en cualquier caso en prácticas. Estas se manejan exactamente en el mismo modo que las interrelaciones mucho a uno.
Relaciones mucho a muchoLas interrelaciones de muchos a muchos (o de muchos a muchos a muchos, etc) mostradas en el ejemplo siguiente:PROY-TRABAJO (asocia empleados y proyectos)PROV-PARTE (asocia proveedores y partes)PROV_PARTE_PROY (asocia proveedores, partes y proyectos)ESTRUCTURA DE PARTES (asocia a partes a partes)Cada una de estas interrelaciones también corresponde a una relación base. Por tanto, introducimos otras cuatro relaciones base correspondientes a estas cuatro interrelaciones. Como en el caso de las interrelaciones de muchos a muchos, resulta que podemos escoger. Una posibilidad es tomar la combinación de la clave ajena y la "clave" de la entidad del diagrama E/R. O bien, podríamos introducir un atributo nuevo no compuesto que sirva como clave primaria.
Enfoque jerarquizadoUna base de datos jerárquica se compone de un conjunto ordenado de árboles, dicho de manera más precisa, un conjunto ordenado formado por múltiples ocurrencias de un solo tipo de árbol.
ÁrbolesUn tipo de árbol consiste en un solo tipo de registro "raíz", junto con un conjunto ordenado de cero o más tipos de subárbol dependientes (de nivel más bajo). Un tipo de subárbol a su vez consiste en un solo tipo de registro la raíz del tipo de subárbol junto con un conjunto ordenado de cero o más tipos de subárbol dependientes, de nivel más bajo, y así sucesivamente. Por tanto, el tipo de árbol completo es un arreglo jerárquico de tipos de registro. Además, claro, los tipos de registro están formados por tipos de campo de la manera acostumbrada.Directorio raíz, en informática, punto de entrada en el árbol de directorios en una estructura jerárquica de directorios. Las ramificaciones de esta raíz son varios directorios y subdirectorios, cada uno de los cuales puede contener uno o más archivos y subdirectorios propios. En la ilustración se muestra una estructura de directorios del sistema operativo MS-DOS. El directorio raíz se identifica con la barra invertida (\) y constituye el directorio principal del disco duro. Por debajo de la raíz hay un directorio denominado MIS DOCUMENTOS, que contiene dos subdirectorios adicionales, CARTAS e INFORMES.
Árboles BinariosLos árboles de grado 2 tienen una especial importancia. Se le conoce con el nombre de Árboles binarios. Se define un árbol binario como un conjunto finito de elementos (nodos) que bien está vació o está formado por una raíz con dos árboles binarios disjuntos, llamados subárbol izquierdo y derecho de la raíz.En los apartados que siguen se consideran únicamente árboles binarios y, por lo tanto, se utilizará la palabra árbol para referirse a árbol binario. Los árboles de grado superior a 2 reciben el nombre de árboles multicamino.
Árbol binario de búsquedaLos árboles binarios se utilizan frecuentemente para representar conjuntos de datos cuyos elementos se identifican por una clave única. Si el árbol esta organizado de tal manera que la clave de cada nodo es mayor que todas las claves su subárbol izquierdo y menor que todas las claves del subárbol derecho se dice que este árbol es un árbol binario de búsqueda.

Operaciones básicasUna tarea muy común a realizar con un árbol es ejecutar una determinada operación con cada uno de los elementos del árbol. Esta operación se considera entonces como un parámetro de una tarea más general que es la visita de todos los nodos o, como se denomina usualmente, del recorrido del árbol.Si se considera la tarea como un proceso secuencial, entonces los nodos individuales se visitan en un orden especifico, y pueden considerarse como organizados según una estructura lineal. De hecho, se simplifica considerablemente la descripción de muchos algoritmos si puede hablarse del proceso del siguiente elemento en el árbol, según su cierto orden subyacente.Hay dos formas básicas de recorrer un árbol: El recorrido en amplitud y el recorrido en profundidad.
Recorrido En AmplitudEs aquel recorrido que recorre el árbol por niveles, en el último ejemplo sería:12 – 8,17 – 5,9,15.Recorrido en profundidad Recorre el árbol por subárboles. Hay tres formas: Preorden, orden central y postordenPREORDEN: Raíz, Subárbol izquierdo, subárbol derechoORDEN CENTRAL: Subárbol izquierdo, raíz, subárbol derechoPOST ORDEN: Subárbol izquierdo, subárbol derecho, raíz. Directorio raíz, en informática, punto de entrada en el árbol de directorios en una estructura jerárquica de directorios. Las ramificaciones de esta: raíz son varios directorios y subdirectorios, cada uno de los cuales puede contener uno o más archivos y subdirectorios propios. En la ilustración se muestra una estructura de directorios del sistema operativo MS-DOS. El directorio raíz se identifica con la barra invertida (\) y constituye el directorio principal del disco duro. Por debajo de la raíz hay un directorio denominado MIS DOCUMENTOS, que contiene dos subdirectorios adicionales, CARTAS e INFORMES.El camino es un elemento más inteligente y posibilita la interconexión de diferentes tipos de redes de ordenadores.Hoja de calculo, programa de aplicación utilizado normalmente en tareas de creación de presupuestos o previsiones, y en otras tareas financieras. En un programa de hoja de calculo, los datos y las formulas necesarios se introducen en formularios tabulares (hojas de cálculos u hojas de trabajo), y se utilizan para analizar, controlar, planificar o evaluar el impacto de los cambios reales o presupuesto sobre una estrategia económica. Los programas de hoja de cálculo usan filas columnas y celdas. Cada celda puede contener texto, datos numéricos o una formula que use valores existentes en otras celdas para hacer un cálculo determinado. Para facilitar los cálculos, estos programas incluyen funciones incorporadas que realizan operaciones estándar. Dependiendo del programa, una sola hoja de cálculo puede contener miles o millones de celdas. Algunos programas de hojas de cálculo permiten también vincular una hoja de cálculos a otra que contenga información relacionada y pueden actualizar de forma automática los datos de las hojas vinculadas. Los programas de hojas de cálculos pueden incluir también utilidades de macros; algunas se pueden utilizar para crear y ordenar bases de datos. Los programas de hoja de cálculo cuentan por lo general con capacidades gráficas para imprimir sus resultados. También proporcionan un buen número de opciones de formato tanto para las páginas y el texto impreso como para los valores numéricos y las leyendas de los gráficos.
Enfoque RelacionalCasi todos los productos de base de datos desarrollados años recientes se basan en lo que se conoce como enfoque relacional. La cuestión es que ningún sistema actual maneja el modelo relacional en todos sus aspectos (varios se acercan, pero la mayor parte fallan en algún detalle u otro; en los dominios, o si no en alguna otra cosa)Bases de datos relaciónales, es decir, bases de datos percibidas por el usuario como tablas y solo como tablas.En una computadora existen diferentes formas de almacenar información. Esto da lugar a distintos modelos de organización de la base de datos: jerárquico, red, relacional y orientada a objeto. Los sistema relacionales son importantes porque ofrecen tipos de procesos de datos, como: simplicidad y generalidad, facilidad de uso para el usuario final, períodos cortos de aprendizaje y las consultas de información se especifican de forma sencilla.Las tablas son un medio de representar la información de una forma más compacta y es posible acceder a la información contenida en dos o más tablas. Mas adelante explicaremos que son las tablas.Las bases de datos relacionales están constituidas por una o más tablas que contienen la información ordenada de una forma organizada. Cumplen las siguientes leyes básicas:
Generalmente, contendrá muchas tablas.
Una tabla sólo contiene un número fijo de campos.
El nombre de los campos de una tabla es distinto.
Cada registro y de la es único.
El orden de los registros y de los campos no está determinado
Para cada campo existe un conjunto de valores posible.
Requisitos Que Han De Tener Las Tablas El primer paso para crear una base de datos, es planificar el tipo de información que se quiere almacenar en la misma, teniendo en cuenta dos aspectos: la información disponible y la información que necesitamos.La planificación de la estructura de la base de datos, en particular de las tablas, es vital para la gestión efectiva de la misma. El diseño de la estructura de una tabla consiste en una descripción de cada uno de los campos que componen el registro y los valores o datos que contendrá cada uno de esos campos.Los campos son los distintos tipos de datos que componen la tabla, por ejemplo: nombre, apellido, domicilio. La definición de un campo requiere: el nombre del campo, el tipo de campo, el ancho del campo, etc.Los registros constituyen la información que va contenida en los campos de la tabla, por ejemplo: el nombre del paciente, el apellido del paciente y la dirección de este. Generalmente los diferentes tipos de campos que se pueden almacenar son los siguientes: texto (caracteres), Numérico (números), Fecha / Hora, Lógico (informaciones lógicas si / no, verdadero / falso, etc., imágenes.En resumen, el principal aspecto a tener en cuenta durante el diseño de una tabla es determinar claramente los campos necesarios, definirlos en forma adecuada con una nombre especificado su tipo y su longitud.Terminología Para Describir La Estructura Relacional.


· Relaciones: corresponde a lo que hasta ahora hemos llamado en general tabla
· Una tupla: corresponde a una fila de esa tabla y un atributo a una columna. El número de tuplas se denomina cardinalidad y el número de atributos se llama grado.
· Campo: columna es la vista lista que muestra una categoría de información como un número de serie o fecha de compra.
· Registro: toda la información relacionada sobre una persona, lugar o cosa.
· Ada, en informática, el lenguaje de programación basado en procedimientos diseñado bajo la dirección del Departamento de Defensa (DOD) de Estado Unidos a finales de la década de 1970. Ada, llamado así en honor a Augusta Ada Byron, condesa de Lovelace y pionera en el campo de la informática, se desarrolló a partir del Pascal, aunque incluía importantes extensiones semánticas y sintácticas, incluyendo la ejecución simultanea de tareas.
· La clave primaria: es única para las tablas, es decir, una columna o combinación de columnas con la siguiente propiedad. Nunca existen dos filas de la tabla con el mismo valor en esa columna o combinación de columnas.
Por último, un dominio es una colección de valores, de los cuales uno o más atributos (columnas) obtienen sus valores reales.

CREACION DE UNA BASE DE DATOS

Para crear una base se deben realizar dos ejercicios de diseño: un diseño lógico y uno físico. El diseño lógico de una base de datos es un modelo abstracto de la base de datos desde una perspectiva de negocios, mientras que el diseño físico muestra como la base de datos se ordena en realidad en los dispositivos de almacenamiento de acceso directo. El diseño físico de la base de datos es llevado a cabo por los especialistas en bases de datos, mientras que el diseño lógico requiere de una descripción detallada de las necesidades de información del negocio de los negocios actuales usuarios finales de la base. Idealmente, el diseños de la base será una parte del esfuerzo global de la planeación de datos a nivel institucional.El diseño lógico de la base de datos describe como los elementos en la base de datos han de quedar agrupados. El proceso de diseño identifica las relaciones entre los elementos de datos y la manera más eficiente de agruparlos para cumplir con los requerimientos de información. El proceso también identifica elementos redundantes y los agrupamientos de los elementos de datos que se requieren para programas de aplicaciones específicos. Los grupos de datos son organizados, refinados y agilizados hasta que una imagen lógica general de las relaciones entre todos los elementos en la base de datos surja.
Bases de datos documentales:Son las derivada de la necesidad de disponer de toda la información en el puesto de trabajo y de minimizar los tiempos del acceso a aquellas informaciones que, si bien se utilizan con frecuencia, no están estructuradas convenientemente . Esto se debe a que ala procedencia de la información es muy variada (informes, notas diversas, periódicos, revistas, muchos más.
Bases de datos distribuidas:Es aquella que se almacena en más de un lugar físico. Partes de la base de datos se almacena físicamente en un lugar y otras partes se almacenan y mantienen en otros lugares. Existen dos maneras de distribuir una base de datos. La base de datos central puede ser particionada de manera que cada procesador remoto tenga los datos necesarios sobre los clientes para servir a su área local. Los cambios en los archivos pueden ser justificado en la base de datos central sobre las bases de lotes, en general por la noche. Otra estrategia también requiere de la actualización de la base central de datos en hojas no laborables.Aun otra posibilidad (una que se emplea en bases de datos grandes) es mantener solo un índice central de nombres y almacenar localmente los registros completos. El procesamiento distribuidos y las bases de datos distribuidas tienen como beneficios e inconvenientes. Los sistemasdistribuidos reducen la vulnerabilidad de un lugar único central y voluminoso. Permiten incremento en la potencia de los sistemas al adquirir mini computadoras que son más pequeñas y baratas. Finalmente incrementan el servicio y la posibilidad de respuesta de los usuarios locales. Los sistemas distribuidos, sin embargo, dependen de la alta calidad de las líneas de telecomunicaciones , las cuales a su vez son vulnerables. Además, las bases de datos locales pueden algunas veces alejarse de las normas y las definiciones de los datos centrales y hacen surgir problemas de seguridad al distribuir ampliamente el acceso a datos de alta sensibilidad.
Bases de datos orientadas a objetos e hipermedia:Estas son capaces de almacenar tanto procesos como datos. Por este motivo las bases orientadas al objeto deben poder almacenar información no convencional (como imágenes estáticas o en movimiento, colecciones de sonidos, entre otros). Este tipo de bases de datos deriva directamente de la llamada programación orientada a objetos, típica por ejemplo del lenguaje C/C++.Entre las ventajas de las bases de datos orientadas al objeto destaca la posibilidad de tratar los casos excepcionales, que suelen ser la mayoría en la práctica cotidiana, en lugar de tratar de insertar la realidad en unos patrones rígidos que violentan para hacerla coincidir con los esquemas utilizados. Además, nadie pone en duda que es más cómodo manejar objetos de entorno que no es familiar, que trabaja, por ejemplo, con tablas, esquemas, cuadros, muchos más.

DISEÑO DE UNA BASE DE DATOS

Existen distintos modos de organizar la información y representar las relaciones entre los datos en una base de datos. Los Sistemas administradores de bases de datos convencionales usan uno de los tres modelos lógicos de bases de datos para hacer seguimiento de las entidades, atributos y relaciones. Los tres modelos lógicos principalmente de bases de datos son el jerárquico, de redes y el relacional. Cada modelo lógico tiene ciertas ventajas de procesamiento y también ciertas ventajas de negocios.
Modelo de jerárquico de datos: Una clase de modelo lógico de bases de datos que tiene una estructura arborescente. Un registro subdivide en segmentos que se interconectan en relaciones padre e hijo y muchos más. Los primeros sistemas administradores de bases de datos eran jerárquicos. Puede representar dos tipos de relaciones entre los datos: relaciones de uno a uno y relaciones de uno a muchos
Modelo de datos en red:Es una variación del modelo de datos jerárquico. De hecho las bases de datos pueden traducirse de jerárquicas a en redes y viceversa con el objeto de optimizar la velocidad y la conveniencia del procesamiento. Mientras que las estructuras jerárquicas describen relaciones de muchos a muchos.Modelo relacional de datos: Es el más reciente de estos modelos, supera algunas de las limitaciones de los otros dos anteriores. El modelo relacional de datos representa todos los datos en la base de datos como sencillas tablas de dos dimensiones llamadas relaciones . Las tablas son semejantes a los archivos planos, pero la información en más de un archivo puede ser fácilmente extraída y combinada...

CONSEPTOS BASICOS DE UNA BASE DE DATOS

Campo: unidad básica de una base de datos. Un campo puede ser, por ejemplo, el nombre de una persona. Los nombres de los campos, no pueden empezar con espacios en blanco y caracteres especiales. No pueden llevar puntos, ni signos de exclamación o corchetes. Si pueden tener espacios en blanco en el medio. La descripción de un campo, permite aclarar información referida a los nombres del campo. El tipo de campo, permite especificar el tipo de información que cargáramos en dicho campo, esta puede ser:
· Texto: para introducir cadenas de caracteres hasta un máximo de 255
· Memo: para introducir un texto extenso. Hasta 65.535caracteres
· Numérico: para introducir números
· Fecha/Hora: para introducir datos en formato fecha u hora
· Moneda: para introducir datos en formato número y con el signo monetario
· Auto numérico: en este tipo de campo, Access numera automáticamente el contenido
· Sí/No: campo lógico. Este tipo de campo es sólo si queremos un contenido del tipo Sí/No, Verdadero/Falso, etc.
· Objeto OLE: para introducir una foto, gráfico, hoja de cálculo, sonido, etc.
· Hipervínculo: podemos definir un enlace a una página Web
· Asistente para búsquedas: crea un campo que permite elegir un valor de otra tabla o de una lista de valores mediante un cuadro de lista o un cuadro combinado.
Registro: es el conjunto de información referida a una misma persona u objeto. Un registro vendría a ser algo así como una ficha.
Campo clave: campo que permite identificar y localizar un registro de manera ágil y organizada.
Propiedades generales de los campos


PROPIEDAD
DESCRIPCIÓN
TIPO DE CAMPO
Tamaño del campo
Permite establecer la longitud máxima de un campo de texto numérico.
Texto, numérico, contador
Formato
Permite determinar la apariencia de presentación de los datos, utilizando los formatos predefinidos o nuestros propios formatos
Todos, excepto OLE y Memo
Lugares decimales
Permite especificar el número de cifras decimales para mostrar los números.
Numérico y moneda
Máscara de entrada
Permite controlar y filtrar los caracteres o valores que los usuarios introducen en un control de cuadro de texto, evitando errores y facilitando su escritura.
Texto, numérico, fecha/hora, moneda
Título
Permite definir una etiqueta de campo predeterminada para un formularios o informe
Todos
Valor predeterminado
Introduce en el campo un valor cuando se agregan nuevos registros (long. Máx. 255 caracteres)
Todos, excepto OLE y contador
Regla de validación
Permite escribir la condición que deben satisfacer los datos introducidos para ser aceptados
Todos, excepto OLE y contador
Texto de validación
Define el texto del mensaje que se visualiza cuando los datos no cumplen las condiciones enumeradas en la regla de validación
Todos excepto OLE y contador
Requerido
Permite especificar si es necesario que exista un valor en un campo.
Todos excepto contador
Permitir longitud cero
Permite especificar si una cadena de longitud cero ("") es una entrada válida para el campo
Texto, memo
Indexado
Define un campo como índice o campo clave.
Texto, numérico, contador, fecha/hora.
Las propiedades de un campo, se establecen seleccionando el campo y haciendo clic en la propiedad deseada del cuadro PROPIEDADES DEL CAMPO situado en la parte inferior de la ventana DISEÑO DE TABLA.
Access tiene una configuración predeterminada para las propiedades de cada uno de los tipos de campo. Sin duda la más importante es el tamaño del campo, ya que este nos permitirá hacer una estimación del espacio ocupado por nuestra base de datos en el disco fijo.