El Modelo Relacional en Bases de Datos: Conceptos Clave y Normalización Esencial

Clasificado en Informática

Escrito el en español con un tamaño de 5,63 KB

El Modelo Relacional: Fundamentos y Evolución en Bases de Datos

El Modelo Relacional se definió a finales de los años 60 con la publicación de un modelo relacional de datos para grandes bancos de datos compartidos por Edgar Frank Codd. Antes, el único método utilizado era el CODASYL. Para Codd, los datos se agrupan en tablas, evitando así que los usuarios tuvieran que aprenderse los entresijos del sistema y haciendo que su trabajo fuera más sencillo e independiente del funcionamiento físico de la base de datos en sí. Codd trabajaba para IBM; sin embargo, esta no expandió sus teorías. Por el contrario, Oracle sí las implementó y, con el paso del tiempo, ha llegado a convertirse en la base de datos más popular.

Objetivos del Modelo Relacional

  • Independencia Física

    Aquí se establece que la forma de almacenar los datos no debe influir en su manipulación lógica, permitiendo que los usuarios se concentren en qué quieren consultar en la base de datos y no en cómo está realizada esta.

  • Independencia Lógica

    Aquí se establece que las aplicaciones que utilizan la base de datos no deben ser modificadas porque se modifiquen elementos de la base de datos; es decir, añadir, borrar, etc., no influye en las vistas de los usuarios, por lo que el esquema externo es independiente del modelo lógico.

  • Flexibilidad

    La Base de Datos (BD) ofrece distintas vistas en función de los usuarios y aplicaciones.

  • Uniformidad

    Las estructuras lógicas siempre tienen una única forma: las tablas.

  • Sencillez

    Se trata de la facilidad de manejo comparada con las versiones anteriores de sistemas gestores de datos.

Estructura de las Bases de Datos Relacionales

Tabla o Relación

Codd definió las relaciones con un lenguaje matemático, pero se asocia a tabla ya que es más fácil entender los conceptos de filas y columnas.

Partes de una Tabla

  • Atributos o Columnas: Se refieren a las propiedades de los datos que se almacenan en la relación, ej.: nombre, DNI, etc.
  • Tuplas o Filas: Se refiere a cada elemento de la relación, ej.: si una relación almacenara personas, la tupla representaría a una persona en concreto.

Una Tupla o Fila representa los elementos individuales de la relación y tiene que cumplir que: cada tupla se tiene que corresponder con un elemento del mundo real y no pueden haber dos tuplas iguales, o sea, con todos los valores iguales.

Dominio

Contiene todos los posibles valores que puede tener un atributo. Dos atributos pueden tener el mismo dominio.

Formas de Indicar el Contenido de un Dominio

  • Intensión: Se trata de la definición exacta de sus posibles valores, ej.: edades de los trabajadores (números enteros que representan las edades entre 16 y 65 años).
  • Extensión: Cuando se indican unos valores y los otros se sobreentienden, ej.: dominio de localidad: Palencia, Ciudad Real, etc.

Además, pueden ser:

  • Generales: Cuando los valores están comprendidos entre un máximo y un mínimo.
  • Restringidos: Cuando solo pueden tomar un conjunto de valores.

Grado

Indica el tamaño de una relación en base al número de columnas o atributos de la misma; a mayor grado, mayor complejidad.

Cardinalidad

Número de filas de una tabla.

Sinónimos Clave en el Modelo Relacional

  • (RELACIONAL, TABLA, FICHERO)
  • (TUPLA, FILA, REGISTRO)
  • (ATRIBUTO, COLUMNA, CAMPO)
  • (GRADO, NÚMERO DE COLUMNAS, NÚMERO DE CAMPOS)
  • (CARDINALIDAD, NÚMERO DE FILAS, NÚMERO DE REGISTROS)

Propiedades de las Tablas o Relaciones

  • Cada tabla tiene un nombre distinto.
  • Cada atributo de la tabla toma un solo valor en cada tupla.
  • Cada atributo tiene un nombre distinto en cada tabla, aunque puede coincidir en tablas distintas.
  • Cada tupla es única.
  • El orden de los atributos y las tuplas no importa.

Normalización de Bases de Datos Relacionales

La normalización es un proceso fundamental para diseñar bases de datos eficientes y sin redundancias.

  • Primera Forma Normal (1FN)

    Se dice que una tabla se encuentra en 1FN si impide que un atributo de una tupla pueda tomar más de un valor (es decir, todos los atributos son atómicos).

  • Segunda Forma Normal (2FN)

    Se da cuando una tabla está en 1FN y, además, cada atributo que no sea clave depende de forma funcional completa respecto de cualquiera de las claves. Toda la clave principal debe hacer dependientes al resto de atributos. Si hay atributos que dependen solo de parte de la clave, entonces estos formarán otra tabla.

  • Tercera Forma Normal (3FN)

    Se da cuando una tabla está en 2FN y, además, ningún atributo que no sea clave depende transitivamente de las claves de la tabla. Esto no ocurre cuando algún atributo depende funcionalmente de atributos que no son clave.

  • Forma Normal de Boyce-Codd (FNBC)

    Se da cuando una tabla está en 3FN y, además, todo determinante es una clave candidata.

  • Cuarta Forma Normal (4FN)

    Se da cuando una tabla está en forma de Boyce-Codd y toda la dependencia es funcional (es decir, no existen dependencias multivaluadas no triviales).

Entradas relacionadas: