domingo, 10 de julio de 2011

¿Qué es una Base de Datos?


La Tecnología de Bases de Datos es hoy un elemento común en la mayoría de todas las aplicaciones de computadoras o tecnología de Información, sin importar el tipo de aplicación, o el giro de la compañía, sea un sistema financiero en un banco, un sistema de punto de venta en un supermercado, o un sistema de control de producción en una empresa manufacturera.  En todos los casos, elementos comunes de Tecnología de Información son tanto las Bases de Datos como los Sistemas de Administración de Bases de Datos requeridos.
La gente interactúa normalmente con Bases de Datos y sus tecnologías asociadas. Para dejar en claro estos términos y tecnologías, se definen a continuación, para aclarar los temas principales que se cubren en este curso. 
Datos
Antes de definir que es una Base de Datos es primordial entender que es un dato. Los datos son hechos, que sirven para describir a objetos, gente, o eventos. Son la materia prima utilizada para producir información.
Base de Datos
Para hablar de una definición de base de datos se debe primero entender algunos requerimientos que deben ser resueltos:
·         La necesidad de compartir datos, entre diferentes usuarios, y que los datos presenten una relación entre ellos, y que estén diseñados para cumplir las necesidades de información de la empresa, y de las diferentes partes que la forman.
·         Una definición de los datos integrada, que ofrezca una definición de los mismos, para poder tener la independencia requerida entre los datos de la empresa, y los programas de aplicación que los van a utilizar.
·         Se requiere de un modelo que represente los datos de la empresa, compuesta comúnmente por entidades, atributos, y relaciones.
Esto permite tener la primera definición de una base de datos:
Es una colección integrada, de datos relacionados. Dicho de otra forma: colección autodescrita de registros relacionados o tablas.  Algunos de sus componentes son:
         Datos del usuario
        La Metadata, o datos acerca de la estructura de la base de datos misma
         Indices y estructuras de datos relacionadas
         Procedimientos almacenados (Stored procedures), o programas o módulos almacenados dentro de la base de datos, y que sirven para su manipulación
         Triggers, o procedimientos que se ejecutan cuando ocurre un evento o actividad particular sobre la base de datos
         Metadata de aplicaciones, o datos que permiten describir las aplicaciones que se ejecutan sobre la base de datos
Dos características son esenciales en la definición de una Base de Datos:
  • Datos relacionados.
         Esta característica implica el que los datos representan hechos, relacionados lógicamente, acerca de aspectos del mundo real que son de interés para el área que apoya una aplicación.  Por ejemplo, los datos que se necesitan en una Base de Datos orientada al área de administración de una empresa, en la cual se manejan datos de: clientes, pedidos que los clientes realizan, los artículos que los pedidos incluyen, el surtido de los pedidos, la facturación a los clientes de sus pedidos entregados, los pagos que los clientes realizan sobre sus facturas, etc. Lo mismo se puede hacer para describir los datos que se manejan en el área de manufactura de una empresa.
  • Datos integrados.
         Esta característica implica que los datos para múltiples aplicaciones se almacenan juntos, y pueden ser manipulados de igual forma por dichas aplicaciones. Al estar almacenados juntos, los datos puedes compartirse, permitiendo que múltiples aplicaciones las utilicen, sin hablar de fronteras, que establecen normalmente barreras artificiales para este uso compartido. Un buen ejemplo es la información que se genera cuando un área de la empresa registra la información de una orden interna para la compra de un producto. Esta información es compartida y utilizada por el área interna de compras, que genera una orden de compra al proveedor, quien surte la orden que será recibida en el almacén, y cuya información comparte con contabilidad, que la requiere para sus registros. Las cuentas por pagar atienden las facturas de los proveedores, en base a la información de los pedidos entregados. Esto ejemplifica la necesidad y la facilidad para compartir estos datos. 
TIPOS DE BASE DE DATOS

Las bases de datos pueden clasificarse de varias maneras, de acuerdo al contexto que se esté manejando, la utilidad de las mismas o las necesidades que satisfagan.
Según la variabilidad de los datos almacenados
Bases de datos estáticas
Éstas son bases de datos de sólo lectura, utilizadas primordialmente para almacenar datos históricos que posteriormente se pueden utilizar para estudiar el comportamiento de un conjunto de datos a través del tiempo, realizar proyecciones y tomar decisiones.
Bases de datos dinámicas
Éstas son bases de datos donde la información almacenada se modifica con el tiempo, permitiendo operaciones como actualización, borrado y adición de datos, además de las operaciones fundamentales de consulta. Un ejemplo de esto puede ser la base de datos utilizada en un sistema de información de un supermercado, una farmacia, un videoclub o una empresa;
Según el contenido
Bases de datos bibliográficas
Solo contienen un subrogante (representante) de la fuente primaria, que permite localizarla. Un registro típico de una base de datos bibliográfica contiene información sobre el autor, fecha de publicación, editorial, título, edición, de una determinada publicación, etc. Puede contener un resumen o extracto de la publicación original, pero nunca el texto completo, porque si no, estaríamos en presencia de una base de datos a texto completo (o de fuentes primarias —ver más abajo). Como su nombre lo indica, el contenido son cifras o números. Por ejemplo, una colección de resultados de análisis de laboratorio, entre otras.
Bases de datos de texto completo
Almacenan las fuentes primarias, como por ejemplo, todo el contenido de todas las ediciones de una colección de revistas científicas.
Directorios
Un ejemplo son las guías telefónicas en formato electrónico.
 Bases de datos o "bibliotecas" de información química o biológica
Son bases de datos que almacenan diferentes tipos de información proveniente de la química, las ciencias de la vida o médicas. Se pueden considerar en varios subtipos:
  • Las que almacenan secuencias de nucleótidos o proteínas.
  • Las bases de datos de rutas metabólicas.
  • Bases de datos de estructura, comprende los registros de datos experimentales sobre estructuras 3D de biomoléculas-
  • Bases de datos clínicas.
  • Bases de datos bibliográficas (biológicas, químicas, médicas y de otros campos): PubChem, Medline, EBSCOhost.
Modelos de bases de datos
Además de la clasificación por la función de las bases de datos, éstas también se pueden clasificar de acuerdo a su modelo de administración de datos.
Un modelo de datos es básicamente una "descripción" de algo conocido como contenedor de datos (algo en donde se guarda la información), así como de los métodos para almacenar y recuperar información de esos contenedores. Los modelos de datos no son cosas físicas: son abstracciones que permiten la implementación de un sistema eficiente de base de datos; por lo general se refieren a algoritmos, y conceptos matemáticos.
Algunos modelos con frecuencia utilizados en las bases de datos:
Bases de datos jerárquicas
Artículo principal: Base de datos jerárquica
Éstas son bases de datos que, como su nombre indica, almacenan su información en una estructura jerárquica. En este modelo los datos se organizan en una forma similar a un árbol (visto al revés), en donde un nodo padre de información puede tener varios hijos. El nodo que no tiene padres es llamado raíz, y a los nodos que no tienen hijos se los conoce como hojas.
Las bases de datos jerárquicas son especialmente útiles en el caso de aplicaciones que manejan un gran volumen de información y datos muy compartidos permitiendo crear estructuras estables y de gran rendimiento.
Una de las principales limitaciones de este modelo es su incapacidad de representar eficientemente la redundancia de datos.
Base de datos de red
Éste es un modelo ligeramente distinto del jerárquico; su diferencia fundamental es la modificación del concepto de nodo: se permite que un mismo nodo tenga varios padres (posibilidad no permitida en el modelo jerárquico).
Fue una gran mejora con respecto al modelo jerárquico, ya que ofrecía una solución eficiente al problema de redundancia de datos; pero, aun así, la dificultad que significa administrar la información en una base de datos de red ha significado que sea un modelo utilizado en su mayoría por programadores más que por usuarios finales.
Bases de datos transaccionales
Son bases de datos cuyo único fin es el envío y recepción de datos a grandes velocidades, estas bases son muy poco comunes y están dirigidas por lo general al entorno de análisis de calidad, datos de producción e industrial, es importante entender que su fin único es recolectar y recuperar los datos a la mayor velocidad posible, por lo tanto la redundancia y duplicación de información no es un problema como con las demás bases de datos, por lo general para poderlas aprovechar al máximo permiten algún tipo de conectividad a bases de datos relacionales.
Bases de datos relacionales
Éste es el modelo utilizado en la actualidad para modelar problemas reales y administrar datos dinámicamente. Tras ser postulados sus fundamentos en 1970 por Edgar Frank Codd, de los laboratorios IBM en San José (California), no tardó en consolidarse como un nuevo paradigma en los modelos de base de datos. Su idea fundamental es el uso de "relaciones". Estas relaciones podrían considerarse en forma lógica como conjuntos de datos llamados "tuplas". Pese a que ésta es la teoría de las bases de datos relacionales creadas por Codd, la mayoría de las veces se conceptualiza de una manera más fácil de imaginar. Esto es pensando en cada relación como si fuese una tabla que está compuesta por registros (las filas de una tabla), que representarían las tuplas, y campos (las columnas de una tabla).
En este modelo, el lugar y la forma en que se almacenen los datos no tienen relevancia (a diferencia de otros modelos como el jerárquico y el de red). Esto tiene la considerable ventaja de que es más fácil de entender y de utilizar para un usuario esporádico de la base de datos. La información puede ser recuperada o almacenada mediante "consultas" que ofrecen una amplia flexibilidad y poder para administrar la información.
El lenguaje más habitual para construir las consultas a bases de datos relacionales es SQL, Structured Query Language o Lenguaje Estructurado de Consultas, un estándar implementado por los principales motores o sistemas de gestión de bases de datos relacionales.
Durante su diseño, una base de datos relacional pasa por un proceso al que se le conoce como normalización de una base de datos.
Durante los años 80 la aparición de dBASE produjo una revolución en los lenguajes de programación y sistemas de administración de datos. Aunque nunca debe olvidarse que dBase no utilizaba SQL como lenguaje base para su gestión.
Bases de datos multidimensionales
Son bases de datos ideadas para desarrollar aplicaciones muy concretas, como creación de Cubos OLAP. Básicamente no se diferencian demasiado de las bases de datos relacionales (una tabla en una base de datos relacional podría serlo también en una base de datos multidimensional), la diferencia está más bien a nivel conceptual; en las bases de datos multidimensionales los campos o atributos de una tabla pueden ser de dos tipos, o bien representan dimensiones de la tabla, o bien representan métricas que se desean estudiar.
Bases de datos orientadas a objetos

Este modelo, bastante reciente, y propio de los modelos informáticos orientados a objetos, trata de almacenar en la base de datos los objetos completos (estado y comportamiento).
Una base de datos orientada a objetos es una base de datos que incorpora todos los conceptos importantes del paradigma de objetos:
  • Encapsulación - Propiedad que permite ocultar la información al resto de los objetos, impidiendo así accesos incorrectos o conflictos.
  • Herencia - Propiedad a través de la cual los objetos heredan comportamiento dentro de una jerarquía de clases.
  • Polimorfismo - Propiedad de una operación mediante la cual puede ser aplicada a distintos tipos de objetos.
En bases de datos orientadas a objetos, los usuarios pueden definir operaciones sobre los datos como parte de la definición de la base de datos. Una operación (llamada función) se especifica en dos partes. La interfaz (o signatura) de una operación incluye el nombre de la operación y los tipos de datos de sus argumentos (o parámetros). La implementación (o método) de la operación se especifica separadamente y puede modificarse sin afectar la interfaz. Los programas de aplicación de los usuarios pueden operar sobre los datos invocando a dichas operaciones a través de sus nombres y argumentos, sea cual sea la forma en la que se han implementado. Esto podría denominarse independencia entre programas y operaciones.
SQL:2003, es el estándar de SQL92 ampliado, soporta los conceptos orientados a objetos y mantiene la compatibilidad con SQL92.
Bases de datos documentales
Permiten la indexación a texto completo, y en líneas generales realizar búsquedas más potentes. Tesaurus es un sistema de índices optimizado para este tipo de bases de datos.
Bases de datos deductivas
Un sistema de base de datos deductiva, es un sistema de base de datos pero con la diferencia de que permite hacer deducciones a través de inferencias. Se basa principalmente en reglas y hechos que son almacenados en la base de datos. Las bases de datos deductivas son también llamadas bases de datos lógicas, a raíz de que se basa en lógica matemática.
Gestión de bases de datos distribuida (SGBD)
La base de datos y el software SGBD pueden estar distribuidos en múltiples sitios conectados por una red. Hay de dos tipos:
1. Distribuidos homogéneos: utilizan el mismo SGBD en múltiples sitios.
2. Distribuidos heterogéneos: Da lugar a los SGBD federados o sistemas multibase de datos en los que los SGBD participantes tienen cierto grado de autonomía local y tienen acceso a varias bases de datos autónomas preexistentes almacenados en los SGBD, muchos de estos emplean una arquitectura cliente-servidor.
Estas surgen debido a la existencia física de organismos descentralizados. Esto les da la capacidad de unir las bases de datos de cada localidad y acceder así a distintas universidades, sucursales de tiendas, etcétera.

 


domingo, 22 de mayo de 2011

Fundamentos de Bases de Datos


1.1 ¿Por qué usar una Base de Datos?
El área de bases de datos ha sido muy importante dentro de la Ciencia de la Computación y más recientemente como parte esencial de las Tecnologías de Información. Al decir que el mundo vive en la era de la información, lo primero que se viene a la mente es el lugar donde se almacenan los datos requeridos para producir información, las Bases de Datos. Este término, también,  ha pasado de ser un término técnico a ser un término de uso diario en cualquier ámbito de trabajo en la vida diaria: la escuela, la casa, la oficina. Debido a todo lo anterior, es necesario el poder aclarar primero estos términos, y contestar las preguntas: ¿Qué es una Base de Datos? ¿Qué es un Sistema de Administración de Base de Datos? ¿Qué Tecnología existía antes de la aparición de las Bases de Datos? Qué ventajas y beneficios ofrecen las Bases de Datos y sus Sistemas de Administración comparados con las tecnologías anteriores?.
Este primer módulo le permitirá introducirse al área de Bases de Datos y sus Sistemas asociados, permitiéndole rápidamente conocer todos sus términos y conceptos. Se presentarán todos los términos necesarios para comprender y aprovechar esta Tecnología. El modulo termina con la presentación de ejemplos de diferentes Bases de Datos, que le permitirán entender y a la vez diferenciar la manera en la cual la tecnología de Bases de Datos se aplica en casos de la vida real.  
El propósito de una Base de Datos es:
… ayudar a la gente y a las organizaciones a llevar un registro de las cosas, de aquellos objetos acerca de los cuales les interesa guardar datos. Estos datos son los que permitirán generar información de esas cosas u objetos. Para comprender por qué es importante este almacenamiento de datos, se puede primero analizar qué problemas se presentan cuando se utilizan sólo datos, sin la estructura que ofrece una Base de Datos:

¿Cuándo se requiere usar un sistema de Administración de Bases de Datos?

Las ventajas de utilizar una Base de Datos, a través del software de administración, se puede entender claramente en los siguientes casos:
1.    Una base de datos permite almacenar grandes volúmenes de datos, con un mínimo de datos duplicados. Esto permite tener un acceso rápido y eficiente a los mismos, cuando se requiere obtener información a partir de ellos. Al estar almacenados en un lugar común, es factible aplicar reglas de integridad, que permite validar su consistencia.
2.    La información almacenada en una base de datos se integra eficientemente, y no posee limitaciones impuestas por la organización de la empresa. Esta integración permite que los datos seas usados eficientemente, y con un mínimo de problemas de integridad, por diferentes usuarios y departamentos en toda la organización. Esto le ofrece como beneficio a un administrador tener acceso a datos a los cuales antes no tenía acceso, por estar almacenados en diferentes medios y sistemas.
3.    Un beneficio muy importante se asocia a la calidad en los servicios de datos. La base de datos permite tener una durabilidad y permanencia de los datos que no es cuestionable. Otro aspecto relacionado a esta ventaja es que las transacciones que se ejecutan directamente sobre la base de datos quedan registradas permanentemente, lo que permite su acceso posterior, para cualquier consulta, o para la protección ante cualquier falla del sistema.
 ¿Por qué aparecen las Bases de Datos?
 

 

Las bases de datos fueron la respuesta a la necesidad de atender las limitaciones y problemas que provocaron los sistemas en base a archivos.
La aparición de las bases de datos obedeció entonces a:
         De acuerdo a lo que los sistemas en base a archivos propusieron, los datos estaban completamente integrados a los programas de aplicación que los definieron, en lugar de estar definidos y almacenados en un lugar separado e independiente de los programas.
         No existía un control en el acceso a los datos, y a la manipulación de los mismos, más allá de los controles impuestos por los mismos programas de aplicación.
Como resultado de lo anterior, aparecieron las bases de datos, y el software definido para su uso, los sistemas de administración o gestión de bases de dato.

Ventaja del enfoque de uso de una base de datos
Un beneficio muy importante asociado al uso de los bases de datos es:
·         El acceso controlado a los datos. Esto redunda en beneficios asociados por el uso de
o    Un sistema de seguridad, que permita el uso de la base de datos solo por el personal autorizado para el uso de la base de datos.
o    Un sistema de control de la integridad, que permita que los datos almacenados cumplan con las reglas de integridad definidas para los mismos, y que garanticen a su ves la integridad y consistencia de la base de datos
o    Un sistema de control de concurrencia., que permita la ejecución de transacciones concurrentes sobre la base de datos, sin perder la integridad de los datos almacenados.
o    Un sistema de recuperación, que permita que la base de datos sea restablecida a un estado correcto o válido de la base de datos, justo antes de que una falla interrumpiera su uso por parte de los programas de aplicación
o    Un mecanismo de vistas, que permita a los usuarios solo acceder a los datos que ellos necesitan usar.
De la discusión de los conceptos de bases de datos se desprende la importancia de hablar de un Sistemas de Administración Bases de Datos, por lo que se incluye este concepto, para su discusión a la luz del concepto de bases de datos. Este concepto será posteriormente presentado.
                                                         Conclusiones
El concepto de bases de datos es fundamental en el manejo de información en una aplicación de negocios. Su importancia no es cuestionable, si se analiza a la luz de los sistemas de información actuales, que requieren ser utilizados en un ambiente de operación basado en Internet.
El concepto de base de datos nace junto con la tecnología de software desarrollada para su definición, uso y administración, los sistemas de administración de bases de datos o DBMSs. Para poder hacer que las expectativas del uso de una base de datos se cumplan, es indispensable el contar con los DBMSs. Su importancia crece al integrar este software cada vez más y más funcionalidades, que le permiten al personal de desarrollo de aplicaciones, desarrollarlas de manera eficiente y rápida.



ESQUEMA DE BASE DE DATOS

QUE ES EL SISTEMA MANEJADOR DE BASE DE DATOS


Definición
El sistema de gestión de bases de datos es esencial para el adecuado funcionamiento y manipulación de los datos contenidos en la base. Se puede definir como: "El Conjunto de programas, procedimientos, lenguajes, etc. que suministra, tanto a los usuarios no informáticos como a los analistas, programadores o al administrador, los medios necesarios para describir, recuperar y manipular los datos almacenados en la base, manteniendo su integridad, confidencialidad y seguridad".
Funciones
Las funciones esenciales de un SGDB son la descripción, manipulación y utilización de los datos.
Descripción: Incluye la descripción de: Los elementos de datos, su estructura, sus interrelaciones, sus validaciones. Tanto a nivel externo como lógico global e interno esta descripción es realizada mediante un LDD o Lenguaje de Descripción de Datos.
Manipulación: Permite: Buscar, Añadir, Suprimir y Modificar los datos contenidos en la Base de Datos.
La manipulación misma supone: Definir un criterio de selección, Definir la estructura lógica a recuperar, Acceder a la estructura física. Esta manipulación es realizada mediante un LMD o Lenguaje de Manipulación de Datos.
Utilización: La utilización permite acceder a la base de datos, no a nivel de datos sino a la base como tal, para lo cual: Reúne las interfaces de los usuarios y suministra procedimientos para el administrador.
Tareas
El manejador es responsable de las siguientes tareas:
1      Interacción con el manejador de archivos:  Los datos en la base se guardan en disco mediante el sistema de archivos, proporcionado comúnmente por el sistema operativo. El manejador de la base, traduce las diferentes proposiciones del manejo de datos en comandos del sistema de archivos de bajo nivel. De esta forma el manejador se puede encargar del almacenamiento, recuperación y actualización de los datos en la base.
2      Implantación de la integridad: Los valores de los datos que se almacenan en la base, deben satisfacer ciertas limitantes de consistencia, estas limitantes deben ser determinadas por el administrador, pero es el manejador el encargado de verificar que las actualizaciones que se hagan a la base cumplan con dichas normas.
3      Puesta en práctica de la seguridad: El manejador de la base es quien verifica que los accesos a la base sean realizados por las personas autorizadas.
4      Respaldo y recuperación: Entre las labores que debe ejecutar el manejador está la de verificar de forma constante la integridad de la base, y lograr recuperación de datos y/o mejoras en caso que se requieran.

DISEÑO DE BASES DE DATOS


Entre las metas más importantes que se persiguen al diseñar un modelo de bases de datos, se encuentran las siguientes que pueden observarse en esta figura.
  1. Almacenar Solo La Información Necesaria.
A menudo pensamos en todo lo que quisiéramos que estuviera almacenado en una base de datos y diseñamos la base de datos para guardar dichos datos. Debemos de ser realistas acerca de nuestras necesidades y decidir qué información es realmente necesaria.
Frecuentemente podemos generar algunos datos sobre la marcha sin tener que almacenarlos en una tabla de una base de datos. En estos casos también tiene sentido hacer esto desde el punto de vista del desarrollo de la aplicación.
1.2. Normalizar la Estructura de las Tablas.
Si nunca antes hemos oído hablar de la "normalización de datos", no debemos temer. Mientras que la normalización puede parecer un tema complicado, nos podemos beneficiar ampliamente al entender los conceptos más elementales de la normalización.
Una de las formas más fáciles de entender esto es pensar en nuestras tablas como hojas de cálculo. Por ejemplo, si quisiéramos seguir la pista de nuestra colección de CD’s en una hoja de cálculo, podríamos diseñar algo parecido a lo que se muestra en la siguiente tabla.

+------------+-------------+--------------+ .. +--------------+
| Álbum | track1 | track2 | | track10 |
+------------+-------------+--------------+ .. +--------------+
Esto parece razonable. Sin embargo el problema es que el número de pistas que tiene un CD varía bastante. Esto significa que con este método tendríamos que tener una hoja de cálculo realmente grande para albergar todos los datos, que en los peores casos podrían ser de hasta 20 pistas. Esto en definitiva no es nada bueno.
Uno de los objetivos de una estructura de tabla normalizada es minimizar el número de "celdas vacías". El darnos cuenta de que cada lista de CD’s tiene un conjunto fijo de campos (título, artista, año, género) y un conjunto variable de atributos (el número de pistas) nos da una idea de cómo dividir los datos en múltiples tablas que luego podamos relacionar entre sí.
Mucha gente no esta familiarizada con el concepto "relacional", de manera sencilla esto significa, que grupos parecidos de información son almacenados en distintas tablas que luego pueden ser "juntadas" (relacionadas) basándose en los datos que tengan en común.
Es necesario que al realizar la estructura de una base de datos, esta sea flexible. La flexibilidad está en el hecho que podemos agregar datos al sistema posteriormente sin tener que rescribir lo que ya tenemos. Por ejemplo, si quisiéramos agregar la información de los artistas de cada álbum, lo único que tenemos que hacer es crear una tabla artista que esté relacionada a la tabla álbum de la misma manera que la tabla pista. Por lo tanto, no tendremos que modificar la estructura de nuestras tablas actuales, simplemente agregar la que hace falta.
La eficiencia se refiere al hecho de que no tenemos duplicación de datos, y tampoco tenemos grandes cantidades de "celdas vacías".
El objetivo principal del diseño de bases de datos es generar tablas que modelan los registros en los que guardaremos nuestra información.
Es importante que esta información se almacene sin redundancia para que se pueda tener una recuperación rápida y eficiente de los datos.
A través de la normalización tratamos de evitar ciertos defectos que nos conduzcan a un mal diseño y que lleven a un procesamiento menos eficaz de los datos.
Podríamos decir que estos son los principales objetivos de la normalización:
  • Controlar la redundancia de la información.
  • Evitar pérdidas de información.
  • Capacidad para representar toda la información.
  • Mantener la consistencia de los datos.
  1. Seleccionar el Tipo de Dato Adecuado.
Una vez identificadas todas las tablas y columnas que necesita la base de datos, debemos determinar el tipo de dato de cada campo. Existen tres categorías principales que pueden aplicarse prácticamente a cualquier aplicación de bases de datos:
  • Texto
  • Números
  • Fecha y hora
Cada uno de éstos presenta sus propias variantes, por lo que la elección del tipo de dato correcto no sólo influye en el tipo de información que se puede almacenar en cada campo, sino que afecta al rendimiento global de la base de datos.
A continuación se dan algunos consejos que nos ayudarán a elegir un tipo de dato adecuado para nuestras tablas:
  • Identificar si una columna debe ser de tipo texto, numérico o de fecha.
  • Elegir el subtipo más apropiado para cada columna.
  • Configurar la longitud máxima para las columnas de texto y numéricas, así como otros atributos.
Utilizar Índices Apropiadamente
Los índices son un sistema especial que utilizan las bases de datos para mejorar su rendimiento global. Dado que los índices hacen que las consultas se ejecuten más rápido, podemos estar incitados a indexar todas las columnas de nuestras tablas.
Sin embargo, lo que tenemos que saber es que el usar índices tiene un precio. Cada vez que hacemos un INSERT, UPDATE, REPLACE, o DELETE sobre una tabla, MySQL tiene que actualizar cualquier índice en la tabla para reflejar los cambios en los datos.
¿Así que, cómo decidimos usar índices o no? La respuesta es "depende". De manera simple, depende que tipo de consultas ejecutamos y que tan frecuentemente lo hacemos, aunque realmente depende de muchas otras cosas.
Así que antes de indexar una columna, debemos considerar que porcentaje de entradas en la tabla son duplicadas. Si el porcentaje es demasiado alto, seguramente no veremos alguna mejora con el uso de un índice. Ante la duda, no tenemos otra alternativa que probar.
Usar Consultas REPLACE
Existen ocasiones en las que deseamos insertar un registro a menos de que éste ya se encuentre en la tabla. Si el registro ya existe, lo que quisiéramos hacer es una actualización de los datos.
 Usar Una Versión Reciente de MySQL
La recomendación es simple y concreta, siempre que esté en nuestras manos, debemos usar la versión más reciente de MySQL que se encuentre disponible. Además de que las nuevas versiones frecuentemente incluyen muchas mejoras, cada vez son más estables y más rápidas. De esta manera, a la vez que sacamos provecho de las nuevas características incorporadas en MySQL, veremos significativos incrementos en la eficiencia de nuestro servidor de bases de datos.
Usar Tablas Temporales.
Cuando estamos trabajando con tablas muy grandes, suele suceder que ocasionalmente necesitemos ejecutar algunas consultas sobre un pequeño subconjunto de una gran cantidad de datos. En vez de ejecutar estas consultas sobre la tabla completa y hacer que MySQL encuentre cada vez los pocos registros que necesitamos, puede ser mucho más rápido seleccionar dichos registros en una tabla temporal y entonces ejecutar nuestras consultas sobre esta tabla.
Una tabla temporal existe mientras dure la conexión a MySQL. Cuando se interrumpe la conexión MySQL remueve automáticamente la tabla y libera el espacio que ésta usaba.
Recomendaciones.
El último paso del diseño de la base de datos es adoptar determinadas convenciones de nombres. Aunque MySQL es muy flexible en cuanto a la forma de asignar nombre a las bases de datos, tablas y columnas, he aquí algunas reglas que es conveniente observar:
  • Utilizar caracteres alfanuméricos.
  • Limitar los nombres a menos de 64 caracteres (es una restricción de MySQL).
  • Utilizar el guión bajo (_) para separar palabras.
  • Utilizar palabras en minúsculas (esto es más una preferencia personal que una regla).
  • Los nombres de las tablas deberían ir en plural y los nombres de las columnas en singular (es igual una preferencia personal).
  • Utilizar las letras ID en las columnas de clave primaria y foránea.
  • En una tabla, colocar primero la clave primaria seguida de las claves foráneas.
  • Los nombres de los campos deben ser descriptivos de su contenido.
  • Los nombres de los campos deben ser unívocos entre tablas, excepción hecha de las claves.
Los puntos anteriores corresponden muchos de ellos a preferencias personales, más que a reglas que debamos de cumplir, y en consecuencia muchos de ellos pueden ser pasados por alto, sin embargo, lo más importante es que la nomenclatura utilizada en nuestras bases de datos sea coherente y consistente con el fin de minimizar la posibilidad de errores al momento de crear una aplicación de bases de datos.
 Base de Datos.- Cualquier conjunto de datos organizados para su almacenamiento en la memoria de un ordenador o computadora, diseñado para facilitar su mantenimiento y acceso de una forma estándar. Los datos suelen aparecer en forma de texto, números o gráficos. Hay cuatro modelos principales de bases de datos: el modelo jerárquico, el modelo en red, el modelo relacional (el más extendido hoy en día). 
Base de Datos Relacional.- Tipo de base de datos o sistema de administración de bases de datos, que almacena información en tablas (filas y columnas de datos) y realiza búsquedas utilizando los datos de columnas especificadas de una tabla para encontrar datos adicionales en otra tabla. 
Datos Elementales.- Un dato elemental, tal como indica su nombre, es una pieza elemental de información. El primer paso en el diseño de una base de datos debe ser un análisis detallado y exhaustivo de los datos elementales requeridos. 
Campos y Subcampos.- Los datos elementales pueden ser almacenados en campos o en subcampos. Un campo es identificado por un rótulo numérico que se define en la FDT de la base de datos. A diferencia de los campos, los subcampos no se identifican por medio de un rótulo, sino por un delimitador de subcampo. 
Delimitador de Subcampo.- Un delimitador de subcampo es un código de dos caracteres que precede e identifica un subcampo de longitud variable dentro de un campo

 DBMS: Data Base Management System (SISTEMA DE MANEJO DE BASE DE DATOS).- Consiste de una base de datos y un conjunto de aplicaciones (programas) para tener acceso a ellos.
Errores que se pueden encontrar en el diseño de una base de datos:
  1. Modelo de Datos.- es un conjunto de herramientas conceptuales para describir los datos, las relaciones entre ellos, su semántica y sus limitantes.
  2. Redundancia.- Esta se presenta cuando se repiten innecesariamente datos en los archivos que conforman la base de datos.
  3. Inconsistencia.- Ocurre cuando existe información contradictoria o incongruente en la base de datos.
  4. Dificultad en el Acceso a los Datos.- Debido a que los sistemas de procesamiento de archivos generalmente se conforman en distintos tiempos o épocas y ocasionalmente por distintos programadores, el formato de la información no es uniforme y se requiere de establecer métodos de enlace y conversión para combinar datos contenidos en distintos archivos.
  5. Aislamiento de los Datos.- Se refiere a la dificultad de extender las aplicaciones que permitan controlar a la base de datos, como pueden ser, nuevos reportes, utilerías y demás debido a la diferencia de formatos en los archivos almacenados.
  6. Anomalías en el Acceso Concurrente.- Ocurre cuando el sistema es multiusuario y no se establecen los controles adecuados para sincronizar los procesos que afectan a la base de datos. Comúnmente se refiere a la poca o nula efectividad de los procedimientos de bloqueo.
  7. Problemas de Seguridad.- Se presentan cuando no es posible establecer claves de acceso y resguardo en forma uniforme para todo el sistema, facilitando así el acceso a intrusos.
à Niveles de Diseño:
  1. Problemas de Integridad.- Ocurre cuando no existe a través de todo el sistema procedimientos uniformes de validación para los datos.
  2. Nivel Físico.- Es aquel en el que se determinan las características de almacenamiento en el medio secundario. Los diseñadores de este nivel poseen un amplio dominio de cuestiones técnicas y de manejo de hardware.
  3. Nivel Conceptual.- Es aquel en el que se definen las estructuras lógicas de almacenamiento y las relaciones que se darán entre ellas. Ejemplos comunes de este nivel son el diseño de los registros y las ligas que permitirán la conexión entre registros de un mismo archivo, de archivos distintos incluso, de ligas hacia archivos.
Clasificación de Modelos de Datos:
  1. Nivel de Edición.- Es aquel en el que se presenta al usuario final y que puede tener combinaciones o relaciones entre los datos que conforman a la base de datos global. Puede definirse como la forma en el que el usuario aprecia la información y sus relaciones.
  2. Modelos Lógicos Basados en Objetos.- Son aquellos que nos permiten una definición clara y concisa de los esquemas conceptuales y de visión. Su característica principal es que permiten definir en forma detallada las limitantes de los datos.
  3. Modelos Lógicos Basados en Registros.- Operan sobre niveles conceptual y de visión. Sus características principales son que permiten una descripción más amplia de la implantación, pero no son capaces de especificar con claridad las limitantes de los datos. 
  4. Modelos Físicos de Datos.- Describen los datos en el nivel más bajo y permiten identificar algunos detalles de implantación para el manejo del hardware de almacenamiento.
  5. QUE SON FORMULARIOS
    Los formularios sirven para definir pantallas generalmente para editar los registros de una tabla o consulta.
    En esta unidad veremos cómo crear un formulario, manejarlo para la edición de registros y cambiar su diseño.
    Para crear un formulario tenemos varias opciones.
    Podemos acceder a todas ellas desde la pestaña Crear:
    Diseño del formulario abre un formulario en blanco en la vista diseño y tenemos que ir incorporando los distintos objetos que queremos aparezca en él. Este método no se suele utilizar ya que en la mayoría de los casos es más cómodo y rápido crear un autoformulario o utilizar el asistente y después sobre el formulario creado modificar el diseño para ajustar el formulario a nuestras necesidades. En esta unidad veremos más adelante cómo modificar el diseño de un formulario.
    Asistente para formularios utiliza un asistente que nos va guiando paso por paso en la creación del formulario.
    Formulario consiste en crear automáticamente un nuevo formulario que contiene todos los datos de la tabla o consulta seleccionada en el Panel de Exploración.
    Gráficos dinámicos abrirá un formulario en blanco basado en la utilización de gráficos dinámicos.
    Explicaremos a continuación la forma de crear un formulario utilizando el asistente.

    El asistente para formularios.
     

    Para arrancar el asistente para formularios haz clic en la opción Asistente para formularios que puedes ver en la imagen anterior.
    Aparece la primera ventana del asistente:
    Primero seleccionamos la tabla o consulta de donde cogerá los datos del cuadro Tablas/Consultas, este será el origen del formulario. Si queremos sacar datos de varias tablas lo mejor será crear una consulta para obtener esos datos y luego elegir como origen del formulario esa consulta.
    A continuación seleccionamos los campos a incluir en el formulario haciendo clic sobre el campo y clic sobre el botón o simplemente doble clic sobre el campo.
    Si nos hemos equivocado de campo pulsamos el botón y el campo se quita de la lista de campos seleccionados.
    Podemos seleccionar todos los campos a la vez haciendo clic sobre el botón o deseleccionar todos los campos a la vez haciendo clic sobre el botón.

    LAS CONSULTAS
    Las consultas son los objetos de una base de datos que permiten recuperar datos de una tabla, modificarlos e incluso almacenar el resultado en otra tabla.
    Existen varios tipos de consultas:
    Consultas de selección.
    Son las consultas que extraen o nos muestran datos. Muestran aquellos datos de una tabla que cumplen los criterios especificados. Una vez obtenido el resultado podremos consultar los datos para modificarlos (esto se podrá hacer o no según la consulta). Una consulta de selección genera una tabla lógica (se llama lógica porque no está físicamente en el disco duro sino en la memoria del ordenador y cada vez que se abre se vuelve a calcular).
    Consultas de acción.
    Son consultas que realizan cambios a los registros. Existen varios tipos de consultas de acción, de eliminación, de actualización, de datos anexados y de creación de tablas.
    Consultas específicas de SQL.
    Son consultas que no se pueden definir desde la cuadrícula QBE de Access sino que se tienen que definir directamente en SQL. Estas consultas no se estudiarán en este curso ya que para definirlas hay que saber SQL, cosa que no es objeto de este curso.
    Pero si tienes ganas de aprender, puedes seguir nuestro Tutorial de SQL, con el que aprenderás a realizar estas consultas.

    Crear una consulta.


    Para crear una consulta, seguir los siguientes pasos:
    Abrir la base de datos donde se encuentra la consulta a crear.
    Hacer clic en el botón Diseño de Consulta en la pestaña Crear:

    También tenemos la posibilidad de utilizar el Asistente para consultas que puedes ver en la imagen anterior para crear consultas con un poco de ayuda.
    Si haces clic en el botón Asistente para consultas aparecerá el siguiente cuadro de diálogo:

    El Asistente para consultas sencillas crea una consulta de selección sencilla como definimos en el apartado anterior.
    Los otros asistentes nos permiten generar tipos especiales de consulta que veremos más adelante.
    Nosotros explicaremos detenidamente la opción Diseño de consulta que te permitirá crear cualquiera de las anteriores por ti mismo.
    Al entrar en la Vista Diseño de consulta nos pide primero las tablas de las que la consulta sacará los datos con un cuadro de diálogo parecido al siguiente:

    Seleccionar la tabla de la que queremos sacar datos y hacer clic sobre el botón Agregar.
    Si queremos sacar datos de varias tablas agregar de la misma forma las demás tablas.
    Finalmente hacer clic sobre el botón Cerrar.
     LOS INFORMES
     
    Los informes sirven para presentar los datos de una tabla o consulta generalmente para imprimirlos. La diferencia básica con los formularios es que los datos que aparecen en el informe sólo se pueden visualizar o imprimir (no se puede modificar) y en los informes se puede agrupar más fácilmente la información y sacar totales por grupos.
    En esta unidad veremos cómo crear un informe utilizando el asistente y cómo cambiar su diseño una vez creado.

    Introducción.
     

    Para crear un informe podemos utilizar a sección Informes que encontrarás en la pestaña Crear:

    Diseño de informe abre un informe en blanco en la vista diseño y tenemos que ir incorporando los distintos objetos que queremos aparezca en él. Este método no se suele utilizar ya que en la mayoría de los casos es más cómodo y rápido crear un auto informe o utilizar el asistente y después sobre el informe creado modificar el diseño para ajustar el informe a nuestras necesidades. En esta unidad veremos más adelante cómo modificar el diseño de un informe.
    Asistente para informes utiliza un asistente que nos va guiando paso por paso en la creación del informe.
    Informe consiste en crear automáticamente un nuevo informe que contiene todos los datos de la tabla o consulta seleccionada en el Panel de Exploración.
    Informe en blanco abre un informe en blanco en vista Presentación.

    Explicaremos a continuación la forma de crear un informe utilizando el asistente.
     

    El asistente para informes.
     

    Para arrancar el asistente para informes haz clic en el botón Asistente para informes que puedes ver en la imagen anterior.


    Aparece la primera ventana del asistente:
    En esta ventana nos pide introducir los campos a incluir en el informe.
    Primero seleccionamos la tabla o consulta de donde cogerá los datos del cuadro Tablas/Consultas este será el origen del informe. Si queremos sacar datos de varias tablas lo mejor será crear una consulta para obtener esos datos y luego elegir como origen del informe esa consulta.
    A continuación seleccionamos los campos haciendo clic sobre el campo para seleccionarlo y clic sobre el botón o simplemente doble clic sobre el campo.
    Si nos hemos equivocado de campo pulsamos el botón y el campo se quita de la lista de campos seleccionados.
    Podemos seleccionar todos los campos a la vez haciendo clic sobre el botón o deseleccionar todos los campos a la vez haciendo clic sobre el botón