Tabla de Contenidos

Iniciación a Oracle

Introducción a las bases de datos

¿Qué es una base de datos?

Una base de datos es un programa residente en memoria, que se encarga de gestionar todo el tratamiento de entrada, salida, protección y elaboración de la información de interés del usuario.

Tipos de bases de datos

Desde el punto de vista de la organización lógica:

  1. Jerárquicas. (Progress)
  2. Relacionales. (Oracle, Access, Sybase…)

Desde el punto de vista de número de usuarios:

  1. Monousuario (dBase, Access, Paradox…)
  2. Multiusuario cliente/servidor (Oracle, Sybase…)

Oracle es una base de datos relacional para entornos cliente/servidor. Todo lo que hablemos a partir de ahora será aplicable sólo a bases de datos Relacionales cliente/servidor, y concretamente para bases de datos Oracle.

Funciones de las bases de datos

  1. Permitir la introducción de datos por parte de los usuarios (o programadores).
  2. Salida de datos.
  3. Almacenamiento de datos.
  4. Protección de datos; seguridad.
  5. Elaboración de datos.

Básicamente, la comunicación del usuario-programador con la base de datos se hace a través de un lenguaje Denominado SQL: Structured Query Laguage (Lenguaje estructurado de consultas)

Conocimientos necesarios:

Para un programador de bases de datos el conocimiento mínimo debe ser de:

  • Conocimiento básico de las estructuras internas de Oracle
  • Lenguaje SQL
  • Utilidades básicas: (SQL*Plus, Export, Import…)
  • PL/SQL
  • Tareas simples de administración
  • Tunning básico de SQL.

Tareas más propias de un administrador de bases de datos pueden ser:

  • Los conocimientos propios de un programador de bases de datos.
  • Conocimiento profundo de estructuras internas de Oracle.
  • Conocimiento profundo de los catálogos de sistema.
  • Utilidades de administración (SQL*DBA, Enterprise Manager…)
  • Tunning avanzado de SQL, red, memoria, discos, CPU…

El modelo relacional

Concepto de tabla

Una tabla es una estructura lógica que sirve para almacenar los datos de un mismo tipo (desde el punto de vista conceptual). Almacenar los datos de un mismo tipo no significa que se almacenen sólo datos numéricos, o sólo datos alfanuméricos. Desde el punto de vista conceptual esto significa que cada entidad se almacena en estructuras separadas. Por ejemplo: la entidad factura se almacena en estructuras diseñadas para ese tipo de entidad: la tabla FACTURA y la tabla FACTURA_COMPRA etc. Así, cada entidad, tendrá una estructura (tabla) pensada y diseñada para ese tipo de entidad. Cada entidad almacenada dentro de la tabla recibe el nombre de registro o fila. Así si la tabla FACTURA almacena 1.000 facturas, se dice que la tabla FACTURA contiene 1.000 registros o filas.

Una tabla se compone de campos o columnas, que son conjuntos de datos del mismo tipo (desde el punto de vista físico). Ahora cuando decimos “del mismo tipo” queremos decir que los datos de una columna son de todos del mismo tipo: numéricos, alfanuméricos, fechas…

Con lo que hemos dicho la estructura de una tabla es esta:

En este esquema se puede ver que cada fila almacena los datos de una factura (es decir, la entidad factura en sí), y cada columna almacena los datos de un mismo tipo (las descripciones, los clientes, etc).

De este modo se pude crear una tabla para cada tipo de entidad, y almacenar en ella los valores correspondientes.

Concepto de índice

Antes de ver qué es un índice tenemos que entender cómo se almacenan los datos. Los registros de una tabla se almacenan uno detrás de otro, respetando las longitudes de cada columna. Esto es una norma general pero en la actualidad no cumple en todas las bases de datos.

La tabla de FACTURA que hemos visto antes tiene la siguiente estructura:

Columna Tipo Ocupación (bytes)
Nº factura N(3) 3+1
Descripción A(50) 50+1
Cliente A(20) 20+1
Importe N(12) 12+1
Descuento N(3) 3+1
Importe final N(10) 10+2

La ocupación se incrementa en uno para incluir una marca de fin de columna, y en la última columna una marca de fin de registro.

La forma de almacenar en el disco duro los registros el ejemplo anterior sería la siguiente:

BOF||001|Tornillos sin rosca••••••••••••••••••••••••••••••|Pepe••••••••••••••••00000000 1000|010|0000000900||002|Tuercas•sin•agujero•••••••••••••••••••••••••••••••|Juancito•••• •••••••••000000005500|000|0000005500||003|Tuercas•de•segunda•mano••••••••••••••••••••••• ••••|Toñete••••••••••••••000000000500|001|0000000495|EOF

Podemos ver que al principio de la tabla hay una marca BOF (Begin Of File), y al final de la tabla una marca EOF (End Of File). Esto delimita el rango en el que están los datos de una determinada tabla.

Hay que darse cuenta que aunque la descripción de la factura no ocupe los 50 caracteres, es base de datos se están almacenando los restantes con el carácter “•”

Si a la base de datos le damos la siguiente orden:

 “Seleccióname la descripción de aquellas facturas cuyo cliente sea Toñete”

Lo que hará es recorrerse el fichero de datos desde la marca BOF hasta la marca EOF, “dando saltos” de N caracteres para leer sólo el campo cliente. Así dará saltos de 55 (3+1+50+1) bytes que es el espacio que hay entre el principio de registro y el principio de la columna “Cliente”. Una vez encontrada esta posición, sabemos que la descripción está 51 bytes anteriores al cliente, así que hay que posicionarse en ese byte, leer el valor y retornar el resultado.

El pseudocódigo que representa este algoritmo puede ser:

 Abrir fichero;
 Bucle mientras no se acabe el fichero
 Dar salto de 54 bytes en el fichero; Valor_campo = Leer 20 bytes de fichero;
 Si valor_campo = “Toñete” entonces
 Posicion_cliente = Posición actual del fichero;
 Dar salto de –posicion_cliente bytes;  // esto va al principio del fichero
 Dar salto de posicion_cliente – 51 bytes; Valor = Leer 50 bytes;
 Retornar valor;
 Fin-si; Fin-bucle;
 Retornar NO_ENCONTRADO;

En este pseudocódigo tenemos que tener en cuenta que la instrucción leer no consume casi tiempo, sin embargo la instrucción dar salto es la que más tiempo consume y cuando mayor sea el número de bytes de desplazamiento, peor. Este es debido a que la operación más lenta en los soportes de disco es la de posicionar las cabezas lectoras en el cilindro y sector adecuados, y una vez que el posicionamiento ya está hecho, la lectura es prácticamente instantánea. Así que en este algoritmo es muy lento porque hace demasiados saltos. A este tipo de lectura se le denomina lectura secuencial o FULL SCAN y es el caso más desfavorable en una consulta a base de datos. Además, cuando mayor sea el volumen de datos, se consiguen peores tiempos con un FULL SCAN.

Un índice es una tabla paralela a otra principal que tan sólo contienen la(s) columna(s) indicada(s) en la creación del índice. Estas columnas se las denomina columnas indexadas.

Podemos usar la analogía del índice de un libro. Cuando nosotros necesitamos buscar un tema en un libro, tenemos dos posibilidades:

  • Recorrernos todas las páginas del libro buscando la primera hoja de cada tema y comprobando si es el que necesitamos. En esta búsqueda perderemos la mayoría del tiempo en pasar hojas (posicionar las cabezas lectoras) buscando el principio de cada tema, y una vez que lo hayamos encontrado, comprobar si el tema es

el deseado (leer el dato) no nos ocupará nada de tiempo.

  • Podemos ir al índice en el que sólo están escritos los títulos de los temas y tan solo con pasar tres hojas

(posicionamiento de cabezas lectoras mínimo) ya hemos recorrido todo el temario. Después vamos a la página (puntero a una posición de disco) que nos indique el índice y consultamos lo que necesitemos.

Los índices en las tablas de BD son equivalentes a los índices de los libros. Siempre que exista índice, debe consultarse porque si no las búsquedas se dispararán en tiempo…

Formas normales

El análisis de un sistema de base de datos consta de varias fases. Entre ellas, las principales son:

Análisis conceptual (o lógico, o relacional): es un análisis abstracto de aquellas entidades que formarán la base de datos, así como las relaciones que establecen unas con otras y las restricciones que se aplican a cada una de ellas. El resultado de esta fase de análisis se ve reflejado en algo llamado Modelo Conceptual o lógico, que es una descripción de las entidades, atributos, relaciones y restricciones que compondrán la base de datos. Existen varios métodos para realizar este análisis: Entidad/Relación, Métrica, Merisse, UML, Yourdon, etc. El análisis conceptual es abstracto, por lo que no depende de la base de datos que vayamos a utilizar ni del sistema en que se vaya a implementar la base de datos.

Análisis físico consta de un análisis específico teniendo en cuenta que base de datos se va a utilizar (Oracle, Sybase…) y en qué arquitectura se va a implementar la base de datos (entornos multiusuario, plataformas NT…)

 Las  formas  normales  no  son  más  que  tres  reglas  que  se  deben  tener  un  cuenta  
 dentro  del  Análisis  conceptual,    utilizando concretamente Entidad/Relación.
 El proceso de aplicar las tres formas normales se llama normalización. 
 Un diseño de base de datos que no cumpla la primera forma   normal no será correcto. 
 Cuantas más formas normales cumpla el diseño de base de datos,  
 significará que la base de datos está más  correctamente analizada.

Primera forma normal: Identificar cada tabla con una clave primaria, y poner los datos en tablas separadas, de manera que los datos de cada tabla sean de un tipo similar (desde el punto de vista conceptual). Segunda forma normal: Sacar las columnas que sólo dependen de una parte de la clave primaria a otra tabla. Tercera forma normal: Incluir en cada tabla sólo datos que pertenezcan a la misma unidad lógica.

Estas tres normas las vamos a explicar con un ejemplo: Dado esta definición de la tabla FACTURA

Columna Tipo
Descripción A(50)
Cliente A(20)
Dirección cliente A(30)
Teléfono cliente A(10)
Importe N(12)

Tenemos la necesidad de identificar cada uno de los registros de esta tabla inequívocamente. No podemos utilizar la descripción porque es posible que haya dos facturas con la misma descripción (dos ventas de tornillos), tampoco el cliente porque un cliente suele tener más de una factura. Ni tampoco el importe porque es normal tener varias facturas con el mismo importe.

Para ello tenemos que definir una nueva columna que nos identifique cada una de las facturas: Es posible (y bastante común) que no encontremos una columna que sea capaz de identificar a al registro completo, por ello se puede definir más de una columna dentro de la clave. En este caso es el conjunto de valores de las columna seleccionadas el que no se podrá repetir.

Esta columna (o conjunto de ellas) se denomina clave primaria (o primary key).

Columna Tipo
(*) Referencia A(10)
Descripción A(50)
Cliente A(20)
Dirección cliente A(30)
Teléfono cliente A(10)
Importe N(12)

Las columnas marcadas con (*) son las que componen la clave primaria.

Ahora podemos estar seguros de que no habrá dos facturas con la misma referencia por lo que podemos consultar la factura con referencia = ‘FFR00123’ y estaremos seguros de que sólo habrá una.

El siguiente paso de la primera forma normal es poner los datos en tablas separadas, asegurándonos de que los datos de una tabla son datos correspondientes a aquello que almacena la tabla.

En este ejemplo podemos ver cómo en la tabla FACTURA se están guardando datos del cliente (dirección y teléfono). En caso de que un cliente tenga más de una factura, estaremos repitiendo la dirección y el teléfono para cada una de las facturas. Esto se denomina redundancia de datos y produce tres efectos negativos:

  1. Mayor ocupación en disco de los datos: el mismo dato se repite N veces.
  2. Posibles inconsistencias de datos: es posible que en una factura el teléfono sea 555-111111 y en otra 555- 111112 (¿cuál de las dos es la correcta?)
  3. Problemas a la hora de cambiar datos repetidos: si un cliente cambia de dirección tenemos que modificar todas sus facturas para cambiarle el dato.
 Hay casos muy especiales en los que la redundancia de datos se recomienda por razones 
 de rendimiento, aunque esta es la excepción que confirma la regla.

La solución que da la primera forma normal a este problema es poner los datos en tablas separadas, dependiendo del origen de la información: la información perteneciente a factura irá en la tabla FACTURA y la información perteneciente a clientes irá en la tabla CLIENTE. Podemos encontrarnos con el problema que los clientes de países distintos tiene una codificación independiente, es decir, que pude existir el cliente 1 de España y el cliente 1 de Francia a la vez.

Un diseño que cumpla la primera forma normal podría ser:

FACTURA
Columna Tipo
(*) Referencia A(10)
Descripción A(50)
Cód país N(3)
Cód. Cliente N(5)
Importe N(12)
 Tan sólo se almacena el código del cliente para cada una de sus facturas, 
 y cuando se tenga que modificar la dirección, se modificará para todas las facturas 
 de ese cliente. Con esto ya hemos hecho que se cumpla la 3ª forma normal.

Y para la tabla CLIENTE hemos tenido que añadir una nueva columna (Código) que sirva para identificar a cada cliente con un código. Dado que es posible que exista el mismo código de cliente varias veces (una vez por cada país), la columna País se ha tenido que incluir dentro de la clave primaria.

La segunda forma normal nos dice que hay que sacar las columnas descriptivas que pertenezcan a la clave a otra tabla. La primera forma normal no nos dice que la tabla CLIENTE está mal definida, ya que todos los campos son datos relacionados con el cliente. Pero vemos que el País se repetirá varias veces, volviendo a caer en el error de la redundancia. Para ello hay que crear una tabla aparte en la que se incluya el código y la descripción del país, así a la hora de almacenar el país en la tabla CLIENTE, sólo se almacenará un código y no su descripción completa que ocupa mucho más espacio. Además a la hora de modificar una descripción, sólo habrá que modificarla una vez.

El esquema en segunda forma normal quedaría así:

FACTURA
Columna Tipo
(*) Referencia A(10)
Descripción A(50)
Cód país N(3)
Cód. Cliente N(5)
Importe N(12)
 En este punto, aunque sólo hayamos aplicado la primera y segunda forma normal,
 ya tenemos la base de datos normalizada, ya que la tercera forma normal, 
 se cumple en todas las tablas.

Una forma de abreviar las formas normales es aplicando directamente la tercera, ya que si un esquema de base de datos cumple la tercera forma normal, automáticamente está cumpliendo la primera y la segunda.

Concepto de relación

Se denomina relación a todo aquellos vínculos que establecen unas tablas con otras, debidos a la aplicación de las formas normales.

En el ejemplo anterior, hemos creado relaciones entre unas tablas y otras desde el momento en que se separan los datos en más de una tabla y se utiliza el código como enlace entre unas y otras. Una relación que hemos creado ha sido la que se establece entre la tabla CLIENTE y la tabla PAIS. Ambas tablas están “intercomunicadas” por una de sus columnas: Cód Pais para CLIENTE y Código para PAIS. Con esta relación sabemos que todo campo Cód País de la tabla CLIENTE, tiene un registro equivalente en la tabla PAIS.

Relación 1-1

La relación 1-1 se establece cuando un registro de la tabla A tiene un solo registro relacionado en la tabla B. Esta relación se podría establecer por ejemplo si creamos una tabla de Pagos de facturas. Suponiendo que una factura se paga de una sola vez, podemos definir la siguiente tabla para almacenar cuando se pagan las facturas:

PAGOS_FACTURA
Columna Tipo
(*) Referencia A(10)
Fecha pago F
Importe original N(12)
% Recargo por retraso N(3)
Importe final N(10)

Podemos ver que la clave de esta tabla sólo es la referencia de la factura. Esto es el dato relevante que nos dice que la relación establecida entre una tabla y otra es 1-1. En la tabla PAGOS_FACTURA sólo puede aparecer una vez cada referencia. Y el la tabla FACTURA sólo puede aparecer una vez cada referencia.

Desde el punto de vista conceptual, las relaciones 1-1 son necesarias y convenientes, para que se cumpla la tercera forma normal y que en cada tabla sólo aparezcan datos correspondientes a su nivel lógico. Sin embargo, desde el punto de vista productivo y práctico, una relación 1-1 se puede sustituir por más registros en la tabla principal. Ya que un registro de A solo puede tener un registro en B, entonces las columnas de B pueden entrar a formas parte de A.

En un análisis más práctico que exhaustivo podríamos haber definido facturas de la siguiente manera:

FACTURA
Columna Tipo
(*) Referencia A(10)
Descripción A(50)
Cód país N(3)
Cód. Cliente N(5)
Importe N(12)
Fecha pago F
%Recargo por retraso N(3)
Importe final N(10)

Relación 1-N

Una relación 1-N es más común que 1-1, ya que, tanto desde el punto de vista conceptual, como desde el práctico, es necesario hacerlas. Volviendo al caso de los pagos de las facturas, podemos permitir que una factura se pague fraccionada, por ejemplo a 30, 60 y 90 días. Para este caso necesitamos que una referencia aparezca más de una vez en la tabla de PAGOS, por lo que la clave primaria debe ser cambiada.

Si la definición de la tabla para una relación 1-N hubiese sido la siguiente:

PAGOS_FRACCIONADOS_FACTURA
Columna Tipo
(*) Referencia A(10)
(*) Fecha pago F
Importe original N(12)
% Recargo por retraso N(3)
Importe final N(10)

Entonces una referencia puede aparecer N veces, una por fecha distinta introducida. Así podemos pagar una factura en las siguientes fracciones.

PAGOS_FRACCIONADOS_FACTURA
Referencia Fecha Importe orig. % Recargo Importe final
RF1102 1/5/2000 100.000 0% 100.000
RF1102 10/6/2000 100.000 10% 110.000
RF1102 1/7/2000 100.000 0% 100.000

Si la clave se hubiese definido sólo como “Referencia”, no podríamos haber insertado más de una fecha para la misma referencia. Sin embargo al definirla como “Referencia, Fecha”, podemos introducir tantas parejas Referencia-Fecha como queramos. En nuestro ejemplo se ha pagado una factura fraccionada en tres pagos con un mes de diferencia entre ellos.

 Las relaciones 1-N también son llamadas normalmente maestro-detalle,  
 donde el maestro es la tabla A (el 1 en la relación) y el detalle es 
 la tabla B (el N en la relación).
 En nuestro ejemplo FACTURA es el maestro y PAGOS_FRACCIONADOS_FACTURA un detalle de FACTURA.

Como norma general (lógicamente tiene sus excepciones) podemos decir que las columnas de la clave primaria de una tabla detalle tienen que ser las mismas que su maestro, añadiendo una (o varias) columnas a la clave (que marcan la diferencia entre el maestro y el detalle).

Esta norma se cumple para nuestro ejemplo.

 Las relaciones 1-N pueden ser optativas u obligatorias en ambos sentidos. 
 Es decir, la tabla A puede estar obligada (o no) a tener registros  relacionados en 
 la tabla B, La tabla B puede estar obligada (o no) a tener registros relacionados en la tabla A.

Una relación típica maestro-detalle, es optativa en sentido A-B pero obligatoria en sentido B-A. Significa que un maestro puede tener o no tener detalles, pero el detalle tiene que tener maestro obligatoriamente.

El concepto de relación es muy común dentro de las bases de datos y está presente continuamente. Es preciso que se maneje con soltura a la hora de definir las claves primarias para cada una de las tablas.

Claves foráneas

 Una  vez  establecidas  las  relaciones  entre  las  tablas,  debemos  estar  seguros  
 de  que  éstas  se  cumplen siempre.  En nuestro ejemplo anterior debemos de 
 asegurarnos de que si hay un registro en PAGOS_FRACCIONADOS_FACTURA, debe existir 
 la correspondiente factura, y que si ésta es borrada, se haga lo mismo con sus pagos.

Las bases de datos nos ofrecen esta posibilidad a través de las claves foráneas, que no son más que un tipo de clave (como la primaria) que hace referencia a otras tablas.

Así la tabla PAGOS_FRACCIONADOS_FACTURA debe definir una clave que compruebe que siempre que se inserte un pago, exista la factura correspondiente (en la tabla FACTURA).

Además la base de datos se encarga de que si queremos borrar una factura (en la tabla FACTURA) no nos deje si existen pagos o bien borre todos los pagos correspondientes.

Las claves foráneas deben crearse sobre las tablas “hijo”, o las tablas B en cada relación, normalmente en los detalles. En nuestro ejemplo de las tablas FACTURA, CLIENTE y PAIS se deben aplicar las siguientes claves foráneas (restricciones).

CLIENTE: Comprobar que no se puede dar de alta un cliente a un país que no exista. Además no se podrá borrar un país siempre que existan clientes dados a ese país. Clave foránea en CLIENTE( cod_pais ) hace referencia sobre PAIS( codigo ) FACTURA: Comprobar que no se puede dar de alta una factura a un cliente (país, cliente) que no exista. También se comprobará que no se pueda borrar un cliente que tenga facturas. Clave foránea en FACTURA(cod_pais,cod_cliente) hace referencia sobre CLIENTE(cod_pais,cod_cliente)

Se puede ver como la tabla PAIS no tiene ninguna clave foránea, ya que es “padre” o tabla A en todas las relaciones establecidas.

Como norma general, cada relación debe tener una clave foránea, y debe crearse sobre la tabla B de la relación que representa.

Normas básicas de codificación

A la hora de definir una tabla hay que tener en cuenta ciertos aspectos en la codificación:

 A la hora de codificar columnas alfanuméricas, hay que tener en cuenta el sistema de ordenación: 
 Dada la siguiente lista de valores (de distinto tipo de dato):
Alfanumérico Numérico
'50' 50
'41' 41
'21' 21
'1' 1
'5' 5
'20' 20
'100' 100
'13' 13
'10' 10
'2' 2

La lista ordenada será la siguiente:

Alfanumérico Numérico
'1' 1
'10' 2
'100' 5
'13' 10
'2' 13
'20' 20
'21' 21
'41' 41
'5' 50
'50' 100

El orden, como vemos, difiere mucho uno de otro.

Sin embargo, dada la siguiente lista de valores (de distinto tipo de dato):

Alfanumérico Numérico
'050' 50
'041' 41
'021' 21
'001' 1
'005' 5
'020' 20
'100' 100
'013' 13
'010' 10
'002' 2

La lista ordenada será la siguiente:

Alfanumérico Numérico
'001' 1
'002' 2
'005' 5
'010' 10
'013' 13
'020' 20
'021' 21
'041' 41
'050' 50
'100' 100

La diferencia está en que el método alfanumérico ordena por posiciones, no por valores absolutos.

 Las descripciones deben ser lo suficientemente largas como para almacenar el 
 caso más desfavorable para la columna, aunque tampoco se deben crear columnas demasiado largas.

Por ejemplo: para albergar nombre y apellidos nos valdrá un 2 nombres de 10 caracteres cada uno, más dos apellidos de 15 caracteres cada uno. Total 35 caracteres. Para darnos un margen de error podemos poner 40 caracteres. Más de esta estimación será una longitud exagerada para el campo.

Codificación compuesta o "claves inteligentes"

En bases de datos antiguas había una práctica muy común que consistía en utilizar una sola columna con varios, significados. El significado de la columna dependía de las posiciones de los dígitos.

Por ejemplo, se podría definir la siguiente regla para almacenar las referencias de las facturas:

Dígitos 1-2	Día de emisión
Dígitos 3-4	Mes de emisión
Dígitos 5-8	Año de emisión
Dígitos 9-14	Código de cliente
Dígitos 14-20	Número de factura

Así la referencia de la factura número 1, emitida a 23/8/1999, para el cliente código 567 sería: 23081999000567000001

Esto no tiene ningún sentido, ya que queda mucho más claro separar cada valor a su columna correspondiente, y si es necesario, definir todas las columnas necesarias como clave.

Fecha	   Cliente	Número
  23/8/1999	567	1

El origen de esta práctica viene de la época de las bases de datos jerárquicas en las que la clave sólo podía estar formada por un campo. Entonces era la única manera de definir una clave compuesta.

Estándar de nomenclatura de objetos

Cuando un equipo de desarrollo da los primeros pasos en un proyecto informático (de bases de datos o de cualquier otro tipo), lo primero que se debe definir es qué estándar de nomenclatura de objetos se va a utilizar. El objetivo principal de esta tarea es que el esquema sea consistente y homogéneo, además de permitir una memorización más rápida de los objetos.

El estándar debe responder a las siguientes preguntas:

  • ¿Los nombres de objetos van en mayúsculas o minúsculas?
  • ¿Debo utilizar nombres lo más descriptivos posibles o sin embargo nombres muy cortos?
  • ¿Puedo usar abreviaturas?
  • ¿Los nombres deben ir en singular o en plural?

El estándar debe ser un documento que tengan presente en todo momento el equipo de desarrollo, y siempre debe aplicarse salvo contadas excepciones.

A continuación daremos ciertas normas, que aunque no pretenden ser un estándar, si que son de recomendado uso:

 Los nombres de objetos (tablas, índices, claves primarias, claves foráneas…) 
 deben ir en  mayúscula. Oracle interpreta por defecto todos los objetos en mayúscula 
 a no ser que se escriba su nombre entre comillas dobles:
Nombres Interpretación de Oracle
Factura, factura y FACTURA Equivalente.
“FACTURA”, “factura”, “Factura” Distintos objetos.
 Los nombres de objetos deben ir en singular ya que el nombre representa a 
 la entidad que almacena, y no las entidades que almacena. 
 Una razón práctica es que con los nombres en minúscula se ahorra 
 1 ó 2 letras, lo cual no es despreciable.
Entidad Nombre recomendado
Facturas FACTURA
Facturas de proveedores FACTURA_PROVEEDOR
Facturas que no han sido pagadas FACTURA_PENDIENTE_PAGO
Facturas caducadas FACTURA_CADUCADA
 Los nombres a utilizar deben ser descriptivos, aunque no deben ser demasiado 
 largos. Oracle admite hasta un máximo de 30 caracteres para los identificadores, 
 aunque no es recomendable llegar hasta el límite.
EntidadNombre recomendado
Empresas pertenecientes al sector de la construcción EMPRESA_CONSTRUCCION
Clientes que han tenido algún impago CLIENTE_MOROSO
Proveedores que se suelen retrasar en sus entregas PROVEEDOR_LENTO, PROVEEDOR_RETRASO
Facturas caducadas de empresas del sector de la construcción FACTURA_CONSTRUCCION_CADUCADA
 Es  recomendable  utilizar  abreviaturas,  sobre  todo  si  el  nombre  más  
 descriptivo  es  demasiado  largo.  Para nombres cortos no es necesario utilizar abreviaturas.
Entidad Nombre recomendado
Empresas pertenecientes al sector de la construcción que han tenido alguna demolición EMPRESA_CONSTR_DEMOLICION
Clientes que han tenido algún impago CLIENTE_MOROSO
Proveedores que se suelen retrasar en sus entregas de empresas del sector de la construcción PROVEEDOR_CONSTR_LENTO, PROVEEDOR_ CONSTR _RETRASO
Facturas caducadas de empresas del sector de la construcción FACTURA_CONSTR_CADUCADA
Almacén de productos terminados para empresas del sector de la construcción ALMACEN_ CONSTR _PROD_TERM
 A la hora de nombrar tablas relacionadas entre si, es recomendable que el nombre 
 empiece por el sufijo que representa la entidad principal.
Entidad Nombre recomendado
Facturas FACTURA
Líneas de Factura (detalle de FACTURA) FACTURA_LINEA
Desglose de las líneas de factura (detalle de FACTURA_LINEA) FACTURA_LINEA_DESGLOSE
Factura impagadas (Relación 1-1 con FACTURA) FACTURA_IMPAGADA, FACTURA_IMPAGO
 Se pueden establecer ciertas abreviaturas para los nombres de columnas:
Columnas típicas Abreviatura
Código de… C_xxx
Descripción de… D_xxx
Referencia de … REF_xxx
Importe de … IMP_xxx
Precio de … PRC_xxx
Porcentaje de … PCT_xxx
Unidades de … UDS_xxx
Tipo de … TIP_xxx
Número de … NUM_xxx
Cualquiera que aparezca un elevado número de veces en el esquema
 Los nombres de clave primaria deben ir precedidos del prefijo PK_ (Primary key), 
 los de índices por IND_, y los de clave foránea por FK_ (Foreing key).

El nombre restante será el de la propia tabla para las claves primarias, el de la tabla referenciada para las claves foráneas y para los índices una o dos palabras descriptivas que indiquen la razón por la que se crea ese índice (si es posible).

Tipos de datos en Oracle

 Los tipos de datos soportados por Oracle se agrupan en los siguientes conjuntos.
Tipos de Datos Oracle
Alfanuméricos Numéricos Fecha Binarios Otros
CHAR NUMBERDATERAW ROWID
VARCHAR2 FLOAT LONG RAW
VARCHAR BLOB
NCHAR CLOB
NVARCHAR2 NLOB
LONG (Obs.) BFILE

Los valores alfanuméricos van encerrados entre comilla simple: 'Alfanumérico' Los valores numéricos son número simples: 123 Las fechas van encerradas entre comillas simples: '1/12/2000' Los valores binarios no pueden ser representados (son fotos, videos…)

Tipo de dato CHAR(b)

Almacena cadenas de caracteres de longitud fija, desde 1 a 2.000 bytes de ocupación. El número de caracteres que se pueden almacenar se rige según la siguiente fórmula.

nº caracteres = bytes / character set

Para ASCII, el conjunto de caracteres ocupa un byte, por lo que coincide el número de caracteres máximos con la ocupación del tipo de dato. Si se introduce un valor de 10 caracteres en un campo de CHAR(100), se tendra que rellenar con 90 posiciones restantes.

Así la siguiente expresión es cierta: 'Hola pepe' = 'Hola pepe '

Si se intenta introducir un valor demasiado grande para el campo, se intentará eliminar los espacios finales, y si cabe sin espacios, se introduce. Si aún así no cabe, se retorna un error.

Tipo de dato VARCHAR2(b)

Almacena cadenas de caracteres de longitud variable. Si se define una columna de longitud 100 bytes, y se introduce en ella un valor de 10 bytes, la columna ocupará 10 y no 100 como hacía con el tipo de dato CHAR.

Tipo de dato VARCHAR(b)

En Oracle es equivalente a VARCHAR2, en futuras versiones permitirá distintos criterios de comparación.

Tipo de dato NCHAR(b)

Almacena un valor alfanumérico de longitud fija con posibilidad de cambio de juego de caracteres. Puede almacenar tanto caracteres ASCII, EBCDIC, UNICODE…

Tipo de dato NVARCHAR2(b)

Almacena un valor alfanumérico de longitud variable con posibilidad de cambio de juego de caracteres. Puede almacenar tanto caracteres ASCII, EBCDIC, UNICODE…

Tipo de dato NUMBER(p,s)

Almacena valores numéricos en punto flotante que pueden ir desde 1.0 x 10-130 hasta 9.9…(38 nueves)… 9 x 10125 . El almacenamiento interno de los valores numéricos en notación científica:

 Mantisa x 10exponente

La mantisa puede contener cualquier número, entero o decimal, positivo o negativo. El exponente podrá contener cualquier número entero, positivo o negativo. El parámetro p indica la precisión (número de dígitos contando los decimales) que contendrá el número como máximo. Oracle garantiza los datos con precisiones de 1 a 38. El parámetro s indica la escala, esto es, el máximo de dígitos decimales. Hay que tener en cuenta que una columna definida NUMBER(10,5), podrá contener como máximo cualquier número siempre y cuando el número de dígitos enteros más el número de dígitos decimales no supere 10 (y no 15). La escala puede ir de -84 a 127. Para definir número enteros, se puede omitir el parámetro s o bien poner un 0 en su lugar. Se puede especificar una escala negativa, esto lo que hace es redondear el número indicado a las posiciones indicadas en la escala. Por ejemplo un número definido como NUMBER(5,-2), redondeará siempre a centenas. Así si intentamos introducir el valor 1355, en realidad se almacenará 1400.

Tipo de dato FLOAT(b)

Almacena un número en punto decimal sin restricción de dígitos decimales.

El parámetro b indica la precisión binaria máxima que puede moverse en el rango 1 a 126. Si se omite el defecto será 126. Una columna FLOAT(126) es equivalente a una columna NUMBER(38), aunque la diferencia está en que la columna NUMBER no podrá contener decimales y la columna FLOAT si y con cualquier escala.

Tipo de dato DATE

Almacena un valor de fecha y hora.

Para un tipo de dato DATE, Oracle almacena internamente los siguiente datos:

  • Siglo
  • Año
  • Mes
  • Día
  • Hora
  • Minuto
  • Segundo

El formato por defecto de las fechas es: 'DD-MON-YYYY' Esto es:

Dos dígitos para el día Las tres primeras siglas del mes (depende del idioma instalado). Cuatro dígitos para el año.

Por ejemplo:

'1-JAN-2001' '2-DEC-1943'

Este formato puede ser alterado en cualquier momento.

Internamente una fecha se almacena como el número de días desde cierto punto de inicio (por ejemplo el año 0). Esto permite que las fechas puedan ser tratadas en operaciones aritméticas normales:

'1-JAN-2001' + 10 = '11-JAN-2001' '1-JAN-2000' - 1 = '31-DEC-1999' '10-MAY-2000' - '1-MAY-2000' = 9

Tipos de datos binarios

Permiten almacenar información en formato “crudo”, valores binarios tal y como se almacenan en el disco duro o como residen en memoria. Estas columnas se pueden utilizar tanto para almacenar grandes cantidades de datos (hasta 4Gb.), como para almacenar directamente cualquier tipo de fichero (ejecutables, sonidos, videos, fotos, documentos Word, DLLs…) o para transportar datos de una base de datos a otra, ya que el formato binario es el único formato común entre cualquier sistema informático.

Tipo de dato LONG (Obsoleto)

Almacena caracteres de longitud variable hasta 2 Gb. Este tipo de dato se soporta para compatibilidad con versiones anteriores. En Oracle y siguientes versiones se debe usar los tipos de datos CLOB y NLOB para almacenar grandes cantidades de datos alfanuméricos.

Tipo de dato ROWID

Representa una dirección de la base de datos, ocupada por una única fila. El ROWID de una fila es un identificador único para una fila dentro de una base de datos. No hay dos filas con el mismo ROWID. Este tipo de dato sirve para guardar punteros a filas concretas.

Lenguaje estructurado de consultas SQL (DML)

SQL es un conjunto de sentencias u órdenes que todos los programas y usuarios deben utilizar para acceder a bases de datos Oracle. No hay otra manera de comunicarse con Oracle si no es a través de SQL. Dado que SQL es un estándar, todas las bases de datos comerciales de la actualidad utilizan SQL como puente de comunicación entre la base de datos y el usuario.

Historia

SQL nació como a partir de una publicación de 1970 escrita por E.F. Cood, y titulada “A relational model of data for large shared data banks” (El modelo de datos relacionales para grandes bancos de datos compartidos). IBM utilizó el modelo planteado por Codd para desarrollar un lenguaje capaz de soportar el recién nacido modelo relacional y así apareció SEQUEL (Structured English QUEry Language). SEQUEL más tarde se convirtió en SQL (Structured Query Language) que continuó pronunciándose en inglés como su predecesor: SEQUEL. En 1979, una desconocida empresa llamada Relational Software, sacó por sorpresa al mercado la primera implementación comercial de SQL. Relational Software más tarde pasó a llamarse Oracle. Después de 20 años, SQL todavía es (y será) siendo el estándar en lenguajes de acceso a base de datos relacionales.

En 1992, ANSI e ISO (organizaciones que se encargan de establecer estándares de todo tipo), completaron la estandarización de SQL y se definió un conjunto de sentencias básicas que debía tener toda implementación para ser llamada estándar. Este SQL se le denominó ANSI-SQL o SQL92.

Hoy en día todas las bases de datos comerciales cumplen el estándar ANSI, aunque cada fabricante añade sus mejoras al lenguaje SQL.

SQL como lenguaje estructurado

En realidad SQL no es un lenguaje en si, como podría ser un lenguaje de programación de 3ª generación (C, Pascal…), sino que en un sublenguaje orientado a acceso y manipulación de base de datos relacionales. Con SQL como única herramienta sólo podemos acceder a las bases de datos, pero no tenemos las estructuras típicas de un lenguaje de programación. Una buena analogía podría ser un sistema operativo. El interfaz de comandos de un SO nos da todo lo que necesitamos para acceder al sistema de ficheros, pero sólo podemos hacer eso, acceder a ficheros. SQL actúa de la misma manera, nos da todo lo que necesitamos para acceder a bases de datos, pero no podemos hacer más.

 Se dice que SQL es estructurado porque trabaja con conjuntos de resultados (result set) 
 abstractos como unidades completas.

Un conjunto de resultados es el esquema básico de una tabla: N filas x N columnas. Este esquema se trata como un todo y es la idea principal de SQL. A la hora de recuperar un conjunto de resultados, éste se trata de la misma forma tenga el número de filas que tenga (0-N) y tenga el número de columnas que tenga (1-N). Además SQL es consistente, esto significa que los “estilos” de las distintas sentencias son uniformes, por lo que el aprendizaje es rápido.

Operadores SQL

Ya hemos visto anteriormente qué tipos de datos se pueden utilizar en Oracle. Y siempre que haya datos, habrá operaciones entre ellos, así que ahora se describirán qué operaciones y con qué operadores se realizan:

Los operadores se pueden dividir en dos conjuntos:

 Aritméticos: utilizan valores numéricos
 Lógicos (o booleanos o de comparación): utilizan valores booleanos o lógicos.
 Concatenación: para unir cadenas de caracteres.

Operadores aritméticos:

Retornan un valor numérico

Símbolo Significado Ejemplo
+ Operación suma 1 + 2
- Operación resta 1 - 2
* Operación multiplicación 1 * 2
/ Operador división 1 / 2

Operadores lógicos:

Retornan un valor lógico (verdadero o falso)

Existen los siguientes comodines:

%: Conjunto de N caracteres (de 0 a ) _: Un solo carácter

Ejemplo:

Las siguientes condiciones retornan TRUE

'significado LIKE 's_gn%fi%d_'
'pepe' LIKE 'pep%'	(todos los que empiecen por 'pep')
'pepote' LIKE 'pep%'
'pepote' LIKE 'pe%te'	(todos los que empiecen por 'pe' y terminen por 'te')
'pedrote' LIKE 'pe%te'

Operador de concatenación:

Retornan una cadena de caracteres

Símbolo Significado Ejemplo
| Concatena una cadena a otra 'juan' || 'cito' ['Juancito']

Oracle puede hacer una conversión automática cuando se utilice este operador con valores numéricos:

10 || 20 = '1020'

Este proceso de denomina CASTING y se puede aplicar en todos aquellos casos en que se utiliza valores numéricos en puesto de valores alfanuméricos o incluso viceversa.

La ausencia de valor: NULL

Todo valor (sea del tipo que sea) puede contener el valor NULL que no es más que la ausencia de valor. Así que cualquier columna (NUMBER, VARCHAR2, DATE…) puede estar a NULL. Una operación retorna NULL si cualquiera de los operandos es NULL. Para comprobar si una valor es NULL se utiliza el operador IS NULL o IS NOT NULL.

Lenguaje de manipulación de datos: DML

 El DML (Data Manipulation Language) es el conjunto de sentencias que está orientadas 
 a la consulta, y manejo de datos de los objetos creados.
 El DML es un subconjunto muy pequeño dentro de SQL, pero es el más importante, ya 
 que su conocimiento y manejo con soltura es imprescindible.
 Básicamente consta de cuatro sentencias: SELECT, INSERT, DELETE, UPDATE.

SELECT

La sentencia SELECT es la encargada de la recuperación (selección) de datos, con cualquier tipo de condición, agrupación u ordenación. Una sentencia SELECT retorna un result set (conjunto de resultados), por lo que podrá ser aplicada en cualquier lugar donde se espere un result set.

La sintaxis básica es:

  SELECT columnas 
    FROM tablas 
   WHERE condición
GROUP BY agrupación
  HAVING condición agrupada
ORDER BY ordenación;

Todas las cláusulas son opcionales excepto SELECT y FROM.

A continuación vamos a hacer una descripción breve de cada cláusula:

SELECT: se deben indicar las columnas que se desean mostrar en el resultado. Las distintas columnas deben aparecer separadas por coma (”,”). Opcionalmente puede ser cualificadas con el nombre de su tabla utilizando la sintaxis:

TABLA.COLUMNA

Si se quieren introducir todas las columnas se podrá incluir el carácter *, o bien TABLA.* Existe la posibilidad de sustituir los nombres de columnas por constantes (1, 'pepe' o '1-may-2000'), expresiones, pseudocolumnas o funciones SQL.

A toda columna, constante, pseudocolumna o función SQL, se le puede cualificar con un nombre adicional:

COLUMNA NOMBRE
CONSTANTE NOMBRE 
PSEUDOCOLUMNA 
NOMBRE FUNCION SQL 
NOMBRE

Si se incluye la cláusula DISTINCT después de SELECT, se suprimirán aquellas filas del resultado que tenga igual valor que otras.

Así

SELECT C_CLIENTE FROM FACTURA; 

Puede retornar

1
3
5
5
1
7
3
2
9



Sin embargo:

SELECT DISTINCT C_CLIENTE FROM ACTURA; Retornará (suprimiendo las repeticiones)

1
3
5
7
2
9

Ejemplos:

SELECT REFERENCIA REF, DESCRIPCION SELECT FACTURA.REFERENCIA, DESCRIPCION SELECT *
SELECT FACTURA.*
SELECT 1 UN_NUMERO_CTE_CUALIFICADO, REFERENCIA SELECT 1+1-3*5/5.4 UNA_EXPRESION_SIN_CUALIFICADA
SELECT DESCRIPCION, ROWNUM UNA_PSEUDOCOLUMNA_CUALIFICADA
SELECT TRUNC( '1-JAN-2001'+1, 'MON' ) UNA_FUNCION_CUALIFICADA SELECT DISTINCT *
SELECT DISTINCT DESCRIPCION, IMPORTE SELECT REFERENCIA||DESCRIPCION

FROM: se indican el(los) result set(s) que interviene(n) en la consulta. Normalmente se utilizan tablas, pero se admite cualquier tipo result set (tabla, select, vista…). Si apareciese más de una tabla, deben ir separadas por coma. Las tablas deben existir y si no existiera alguna aparecería el siguiente error: ORA-00942: table or view does not exist Al igual que a las columnas, también se puede cualificar a las tablas TABLA NOMBRE Oracle tiene definida una tabla especial, llamada DUAL, que se utiliza para consultar valores que no dependen de ningún result set.

SELECT (1+1.1*3/5)-1-2 FROM DUAL;

Ejemplos:

FROM FACTURA FAC
FROM FACTURA FAC, CLIENTE CLI FROM DUAL
FROM ( SELECT C_CLIENTE FROM FACTURA ) CLIENTE_FAC

WHERE: indica qué condiciones debe cumplirse para que una fila entre dentro del result set retornado. Para construir las condiciones se podrán utilizar todos los operadores lógicos vistos anteriormente. Es posible construir condiciones complejas uniendo dos o más condiciones simples a través de los operadores lógicos AND y OR.

Ejemplos:

WHERE FACTURA.REFERENCIA = 'AA3455' 
WHERE FACTURA.C_CLIENTE IS NULL
WHERE C_CLIENTE BETWEEN '12' AND '20'
WHERE C_CLIENTE IS NULL AND REFERENCIA IN ('AA23344', 'BB23345')
WHERE C_CLIENTE != 55 OR REFERENCIA LIKE 'AA%5_'

GROUP BY: La expresión GROUP BY se utiliza para agrupar valores que es necesario procesar como un grupo. Por ejemplo, puede darse el caso de necesitar procesar todas las facturas de cada cliente para ver su total, o para contarlas, o para incrementarles un 10%… Para estos casos se haría un SELECT agrupando por C_CLIENTE. Un SELECT con GROUP BY es equivalente a un SELECT DISTINCT, siempre y cuando en el SELECT no aparezcan consultas sumarias (ver apartado Funciones SQL). Trataremos con más profundidad este tipo de consultas en el apartado “Consultas agrupadas”.

HAVING: Se utiliza para aplicar condiciones sobre agrupaciones. Sólo puede aparecer si se ha incluido la cláusula GROUP BY. Trataremos con más profundidad este tipo de consultas en el apartado “Consultas agrupadas”.

ORDER BY: Se utiliza para ordenar las filas del result set final.

Dentro de esta cláusula podrá aparecer cualquier expresión que pueda aparecer en el SELECT, es decir, pueden aparecer columnas, pseudocolumnas, constantes (no tiene sentido, aunque está permitido), expresiones y funciones SQL. Como característica adicional, se pueden incluir números en la ordenación, que serán sustituidos por la columna correspondiente del SELECT en el orden que indique el número.

La ordenación es el último paso en la ejecución de una consulta SQL, y para ello Oracle suele necesitar crear objetos temporales que son creados en el tablespace Temporal. Por eso es recomendable hacer las ordenaciones del lado de cliente (siempre que sea posible), ya que el servidor puede cargarse bastante si tiene que hacer, por ejemplo, 300 ordenaciones de tablas de 2 millones de registros.

Después de cada columna de ordenación se puede incluir una de las palabras reservadas ASC o DESC, para hacer ordenaciones ASCendentes o DESCendentes. Por defecto, si no se pone nada se hará ASC.

Ejemplos:

ORDER BY REFERENCIA ASC
ORDER BY REFERENCIA DESC, C_CLIENTE DES, IMPORTE ASC 
ORDER BY C_CLIENTE
ORDER BY 1, C_CLIENTE, 2
ORDER BY TRUNC( '1-JAN-2001'+1, 'MON' )
ORDER BY 1.1+3-5/44.3 -- no tiene sentido ordenar por una cte.

Consultas agrupadas

 Una consulta agrupada se utiliza para considerar los registros cuyos ciertos 
 campos tienen el mismo valor, y procesarlos de la misma manera, 
 para contarlos, sumarlos, hacer la media…

Las consultas típicas son para contar los registros de cierto tipos, sumar los importes de cierto cliente, etc. Por ejemplo, vamos a sacar el total del importe de las factura, por cliente:

SELECT C_CLIENTE, SUM(IMPORTE)
FROM	FACTURA
GROUP BY C_CLIENTE;

Esto nos sumará (la función SUM suma su parámetro) los registro agrupando por cliente. Internamente Oracle tiene que hacer una ordenación interna de los registros, según las columnas incluidas en el GROUP BY, así que todo lo dicho para el ORDER BY se puede aplicar para el GROUP BY (sobrecarga del servidor).

Cuando en la cláusula SELECT no se incluyen funciones SQL (para más información ver el apartado Funciones SQL), una consulta GROUP BY es equivalente a una consulta SELECT DISTINCT.

Un error muy común cuando se construyen consultas agrupadas, es el siguiente:

ORA-00979: not a GROUP BY expression

Esto es debido al modo que tiene Oracle de analizar las consultas agrupadas: Lo que hace es comprobar que todos las columnas incluidos en la cláusula SELECT fuera de funciones sumarias, estén dentro de la cláusula GROUP BY, aunque pueden estar en cualquier orden y en el GROUP BY pueden aparecer columnas que no estén en el SELECT. Si encuentra alguna columna en el SELECT (que no esté dentro de una función sumaria) que no aparezca en el GROUP BY, entonces nos retorna el error anterior. Si pensamos la situación, es lógico que nos retorne un error, porque no podemos agrupar por la columna C_CLIENTE, si luego queremos mostrar otras columnas que estén sin agrupar. O agrupamos por todo, o mostramos sin agrupar, pero ambas a la vez no es posible.

Ejemplos de consultas agrupadas:

SELECT C_CLIENTE, SUM( IMPORTE )
FROM FACTURA
GROUP BY C_CLIENTE;
 
SELECT C_PAIS, SUM( IMPORTE ) FROM FACTURA
GROUP BY C_PAIS;
 
SELECT C_CLIENTE, COUNT(*) FROM FACTURA
GROUP BY C_CLIENTE;
 
SELECT C_CLIENTE, SUM(1) FROM FACTURA
GROUP BY C_CLIENTE;
 
SELECT C_PAIS, AVG( IMPORTE ) FROM FACTURA
GROUP BY C_PAIS;
 
SELECT C_PAIS, COUNT(*) FROM	CLIENTE
GROUP BY C_PAIS,
 
SELECT C_CLIENTE + AVG( IMPORTE ) FROM	FACTURA;

Consultas multitabla

 Es posible que para consultas sencillas, todos los datos que necesitemos estén en 
 una sola tabla. Pero… ¿y si están repartidos por una, dos o muchas tablas?

Es posible hacer consultas que incluyan más de una tabla (o result set) dentro de la cláusula FROM, como ya vimos anteriormente. Pero en estas consultas hay que tener en cuenta ciertos factores.

Vemos lo que hace Oracle para esta consulta:

SELECT F.REFERENCIA, F.C_CLIENTE, C.C_CLIENTE, C.D_CLIENTE
FROM  FACTURA F, CLIENTE C;

Suponiendo que tenemos los siguientes datos:

FACTURA
Referencia C_Cliente
A111 1
A112 2
A113 1
A114 5
A115 2
CLIENTE
C_Cliente D_Cliente
1 Pepote
2 Juancito
5 Toñete

El select anterior nos retornará el siguiente result set

F.REFERENCIA F.C_CLIENTE C.C_CLIENTE C.D_CLIENTE
A111 1 1 Pepote
A111 1 2 Juancito
A111 1 5 Toñete
A112 2 1 Pepote
A112 2 2 Juancito
A112 2 5 Toñete
A113 1 1 Pepote
A113 1 2 Juancito
A113 1 5 Toñete
A114 5 1 Pepote
A114 5 2 Juancito
A114 5 5 Toñete
A115 2 1 Pepote
A115 2 2 Juancito
A115 2 5 Toñete

Podemos ver que el resultado es el producto cartesiano de una tabla por otra tabla, es decir, todas las combinaciones posibles de la tabla FACTURA con la tabla CLIENTE. Pero en realidad lo que a nosotros nos interesa es mostrar todas las facturas, pero con la descripción del cliente de cada factura, es decir, que cada factura seleccione sólo su registro correspondiente de la tabla CLIENTE. Los registros que a nosotros nos interesan están marcados en negrita en el esquema anterior, y en todos ellos se cumple que F.C_CLIENTE = C.C_CLIENTE. O dicho de otro modo, los campos que componen la relación igualados. Entonces del result set anterior, sólo nos interesan los registros marcados en negrita, y el select que nos retorna ese resultados es:

SELECT F.REFERENCIA, F.C_CLIENTE, C.C_CLIENTE, C.D_CLIENTE
FROM  FACTURA F, CLIENTE C
WHERE F.C_CLIENTE = C.C_CLIENTE;

El resultado final es:

F.REFERENCIA F.C_CLIENTE C.C_CLIENTE C.D_CLIENTE
A111 1 1 Pepote
A112 2 2 Juancito
A113 1 1 Pepote
A114 5 5 Toñete
A115 2 2 Juancito

Esto son con la descripción del cliente.

Como norma general se puede decir que para combinar dos o más tablas hay que poner como condición la igualdad entre las claves de una tabla y el enlace de la otra. Las condiciones dentro del WHERE que sirven para hacer el enlace entre tablas se denominan JOIN (unión, enlace).

Nota: en el ejemplo utilizado hemos omitido por simplicidad la columna C_PAIS que también forma parte de la clave, así que el join debería hacerse con las columnas C_PAIS y C_CLIENTE.

Existe un caso especial cuando se establece un “join” entre tablas: el outer-join. Este caso se da cuando los valores de los campos enlazados en alguna de las tablas, contiene el valor NULL.

Al realizar un join, si algún campo enlazado contiene el valor NULL, es registro quedará automáticamente excluído, ya que una condición en la que un operando sea NULL siempre se evalúa como falso.

Supongamos que las tablas utilizadas en el ejemplo anterior ahora tienen los siguientes datos:

FACTURA
Referencia C_Cliente
A111 1
A112 NULL
A113 1
A114 NULL
A115 7
CLIENTE
C_Cliente D_Cliente
1 Pepote
2 Juancito
5 Toñete

Si realizamos la misma consulta (las facturas con la descripción de cliente), no aparecerán las facturas “A112” y “A114”, ya que su campo C_CLIENTE contiene un NULL, y al evaluar la condición de join (WHERE FACTURA.C_CLIENTE = CLIENTE.C_CLIENTE), no se evaluará como verdadero. Además, tampoco aparecerá la factura “A115”, porque el cliente “7” no existe en la tabla de clientes.

Sin embargo, puede ser que necesitemos mostrar todas las facturas de la base de datos, independientemente de si el cliente existe o si el campo está a NULL.

Para ello debemos utilizar un outer-join, que no es más que un JOIN con un modificador (+), indicando que queremos considerar aquellos registros que se descarten por existencia de nulos.

El select final sería así

SELECT F.REFERENCIA, F.C_CLIENTE, C.C_CLIENTE, C.D_CLIENTE
FROM  FACTURA F, CLIENTE C
WHERE F.C_CLIENTE = C.C_CLIENTE(+);

El resultado de ejecutar este select es:

F.REFERENCIA F.C_CLIENTE C.C_CLIENTE C.D_CLIENTE
A111 1 1 Pepote
A113 1 1 Pepote
A115 2 7 NULL
A112 NULL NULL NULL
A114 NULL NULL NULL

Esta consulta podría leerse con el siguiente enunciado:

“Selecionar las facturas que tengan cliente (el join) y aquellas que no encuentren su referencia en la tabla cliente (en outer-join)”.

Es importante fijarse en la posición en que se ha colocado el modificador (+). Si se sitúa detrás del campo de la tabla cliente, significa que se recuperen las todas las facturas, aunque no encuentren referencia al cliente, sin embargo, si lo ponemos detrás del campo de la tabla factura:

SELECT F.REFERENCIA, F.C_CLIENTE, C.C_CLIENTE, C.D_CLIENTE
FROM  FACTURA F, CLIENTE C
WHERE F.C_CLIENTE(+) = C.C_CLIENTE;

Significaría que recupere todos los clientes, aunque no encuentre la referencia de la factura.

Sólo queda por comentar que si en join entre las tablas es de varios campos, debe indicarse el símbolo del outer (+) en todos los campos, y en la misma posición en todos ellos.

Pseudocolumnas

Una pseudocolumna es una columna válida para poner en cualquier cláusula SELECT, independientemente de las tablas incluidas en la clausula FROM.

Las pseudocolumnas válidas para Oracle son:

CURRVAL y NEXTVAL: sólo válidas si el objeto del FROM es una secuencia. Permiten recuperar el valor actual y siguiente (respectivamente) de una secuencia. Para más información sobre las secuencias ir a al apartado CREATE SEQUENCE.

LEVEL: Retorna el nivel para consultas jerárquicas. Las consultas jerárquicas se realizan utilizando las cláusulas START WITH y CONNECT BY de la sentencia SELECT. Para más información sobre consultas jerárquicas, dirigirse a la ayuda se la sentencia SELECT en el Oracle SQL Reference.

ROWID: Retorna una dirección de disco donde se encuentra la fila seleccionada. Es un valor único para cada fila de la base de datos.

ROWNUM: Es un valor consecutivo para cada fila retornada por una consulta. La primera fila tendrá un 1, la segunda un 2, etc. Se suele utilizar para restringir el tamaño del result set, por ejemplo, si queremos que sólo retorne las 5 primeras facturas:

SELECT *
FROM FACTURA
WHERE ROWNUM <= 5;

Hay que tener en cuenta que una consulta de este estilo:

SELECT *
FROM FACTURA
WHERE ROWNUM > 1;

Nunca retornará resultado, porque siempre habrá una fila que sea la primera. Después de que el WHERE elimine la primera fila, el ROWNUM de todas las filas restantes de recalculará y volverá a haber otra nueva primera fila. Así se seguirá aplicando la condición de filtro hasta que no queden filas. Por eso no retorna ninguna fila. El valor de ROWNUM se aplica antes de que se ordene el result set

SYSDATE: Nos retorna un tipo de dato DATE con la fecha y hora del sistema (según el reloj del servidor de base de datos).

USER, UID: Nos retorna el nombre e identificador de usuarios de la sesión activa.

INSERT

La sentencia INSERT nos permite introducir nuevas filas en una tabla de base de datos. La sintaxis básica es:

INSERT INTO tabla{( campos )} VALUES( lista de valores );

Los nombres de los campos detrás del nombre de tabla son opcionales y si no se ponen se supondrá todos los campos de la tabla en su orden original. Si se ponen, se podrán indicar cualquier número de columnas en cualquier orden.

La lista de valores es el registro que se insertará en la tabla. Los tipos de datos deben coincidir con la definición dada en la cláusula INTO o con la definición de la tabla si omitimos dicha cláusula. Las columnas que no se incluyan en el INTO, de inicializarán con NULL, (si no se ha definido valor en el DEFAULT).

Existe otra sintaxis que se denomina INSERT masivo:

INSERT INTO tabla{( campos )} SELECT . . .

Este tipo de INSERT permite introducir un gran número de registros en una sola sentencia. Al igual que con el INSERT normal, los tipos de datos del SELECT deben coincidir con la definición de la cláusula INTO.

Ejemplos:

INSERT INTO FACTURA
VALUES( 'A111', 'Factura nueva', 1, 5, 50000 );
 
INSERT INTO FACTURA( C_PAIS, REFERENCIA, IMPORTE, C_CLIENTE, DESCRIPCIPCION ) 
VALUES( 1, 'A111', 50000, 5, 'Factura nueva' );
 
INSERT INTO FACTURA( REFERENCIA, IMPORTE ) VALUES( 'A111', 50000 );
 
INSERT INTO FACTURA( C_PAIS, C_CLIENTE ) SELECT C_PAIS, C_CLIENTE
FROM CLIENTE;

DELETE

La sentencia DELETE nos permite eliminar filas en una tabla de base de datos conforme a una condición. Es equivalente al SELECT, pero en vez de mostrar las filas que cumplan la condición, las elimina.

Su sintaxis es:

DELETE {FROM} tabla {WHERE condición};

Si se omite la cláusula WHERE se borrarán todas las filas de la tabla. Las condiciones pueden ser las mismas que las aplicadas en una sentencia SELECT.

En la cláusula FROM no puede haber más de una tabla, por lo que no es posible hacer joins en un DELETE. Para hacer un “pseudojoin” hay que utilizar el operador IN comparando los campos clave de la tabla a borrar con el subselect de la tabla con la que se quiere hacer el join.

Ejemplos:

DELETE FROM FACTURA WHERE REFERENCIA = 'A111'; DELETE FACTURA;
 
DELETE FACTURA WHERE C_PAIS = 1 AND C_CLIENTE = 5;
 
DELETE FROM FACTURA WHERE REFERENCIA NOT IN ( SELECT REFERENCIA 
                                                FROM FACTURA
                     WHERE C_CLIENTE = 4 );
 
DELETE FROM FACTURA WHERE C_CLIENTE != 4;
 
DELETE FROM FACTURA WHERE (C_PAIS,C_CLIENTE) IN ( SELECT C_PAIS, C_CLIENTE 
                                                    FROM CLIENTE
         WHERE  D_CLIENTE LIKE '%Fernández%' );
 
 
DELETE FROM FACTURA
WHERE (C_PAIS,C_CLIENTE) IN ( SELECT C_PAIS, C_CLIENTE FROM CLIENTE
WHERE  CLIENTE.C_PAIS = FACTURA.C_PAIS 
  AND CLIENTE.C_CLIENTE = FACTURA.C_CLIENTE 
  AND D_CLIENTE LIKE '%Fernández%' );

UPDATE

La sentencia UPDATE se encarga de modificar registros ya existentes en una tabla. Es equivalente a la sentencia DELETE, pero en vez de borrar, actualiza las columnas indicadas que cumplan la condición impuesta.

Sintaxis:

UPDATE tabla
SET	campo = valor, campo = valor,
. . .
{WHERE condición};

El valor puede ser tanto un valor discreto (1, 'pepe', '1-jan-2000', etc), un valor dependiente de otra una columna (IMPORTE*10) o un subselect que retorne un result set de 1×1 (1 fila y 1 una columna). Si se utiliza un subselect se puede hacer join entre este subselect y la tabla del UPDATE.

Si se omite la cláusula WHERE, se actualizarán todas las filas de la tabla.

Ejemplos:

UPDATE FACTURA
SET	IMPORTE = 1000
WHERE	C_PAIS	= 1 
  AND  C_CLIENTE = 5;
 
UPDATE FACTURA
SET	IMPORTE = IMPORTE * 0.5
WHERE	C_PAIS	= 1 
  AND  C_CLIENTE = 5;
 
UPDATE FACTURA F1
SET	IMPORTE = ( SELECT AVG(IMPORTE) * 1.10
FROM  FACTURA F2
WHERE F1.C_PAIS	= F2.C_PAIS 
  AND F1.C_CLIENTE = F2.C_CLIENTE );
 
UPDATE FACTURA F1
SET    IMPORTE = ( SELECT AVG(F2.IMPORTE) + F1.IMPORTE FROM  FACTURA F2
WHERE F1.C_PAIS	= F2.C_PAIS 
  AND F1.C_CLIENTE = F2.C_CLIENTE );

Lenguaje de definición de datos: DDL

El DDL (Data Definition Language) es el conjunto de sentencias que está orientadas a la creación, modificación y configuración de objetos en base de datos. El DDL es el subconjunto más extenso dentro de SQL así que sólo vamos a hacer una referencia rápida a algunas sentencias. Se puede encontrar una descripción detallada del todo el DDL dentro del Oracle SQL Reference.

CREATE TABLE

Crea una tabla en base de datos. La sintaxis básica es:

CREATE TABLE nombre_tabla(
COLUMNA TIPO [NOT NULL],
COLUMNA TIPO [NOT NULL],
 
{CONSTRAINT nombre_clave_primaria PRIMARY KEY (columnas_clave)}
{CONSTRAINT nombre_clave_foránea
FOREIGN KEY(columnas_clave) REFERENCES tabla_detalle( columnas_clave )
{ON DELETE CASCADE} }  )
{TABLESPACE tablespace_de_creación}
{STORAGE( INITIAL XX{K|M} NEXT XX{K|M} )}

La creación de la tabla FACTURA definida en la página 6 sería la siguiente:

CREATE TABLE FACTURA(
REFERENCIA  NUMBER(30)	NOT NULL, DESCRIPCION VARCHAR2(50),
C_PAIS	NUMBER(3), C_CLIENTE	NUMBER(5), IMPORTE	NUMBER(12),
CONSTRAINT PK_FACTURA PRIMARY KEY( REFERENCIA )
CONSTRAINT FK_CLIENTE(C_PAIS,C_CLIENTE) REFERENCES CLIENTE( C_PAIS, C_CLIENTE) ON DELETE CASCADE
TABLESPACE tab_facturas
STORAGE( INITIAL 1M NEXT 500K );

Los campos que van a formar parte de la clave se tienen que definir como NOT NULL ya que no tiene sentido que éstas columnas carezcan de valor. Además se crea la clave primaria y la clave foránea que hace referencia a CLIENTE (como ya dijimos en el apartado de claves foráneas). Con la cláusula ON DELETE CASCADE hacemos que si se borra un cliente, se borren automáticamente todas sus facturas. Si no la incluyésemos, al borrar el cliente, nos daría el siguiente error:

ORA-02292: integrity constraint (FK_CLIENTE) violated - child record found

Hay que tener en cuenta que aunque la clave foránea se crea sobre la tabla FACTURA, también actúa cuando se hacen operaciones sobre CLIENTE.

Al intentar insertar una factura a un cliente inexistente nos dará el siguiente error:

ORA-02291: integrity constraint (FK_CLIENTE) violated - parent key not found

Se puede encontrar una descripción detallada de todos los errores en el Oracle Error Messages.

CREATE INDEX

Crea un índice sobre una tabla de base de datos. La sintaxis básica es:

CREATE {UNIQUE} INDEX nombre_índice
ON tabla( columnas_indexadas )
{TABLESPACE tab_indices}
{STORAGE( INITIAL XX{K|M} NEXT XX{K|M} )}

La cláusula UNIQUE actúa como si los campos indexados fuesen clave primaria, es decir, no permite que el conjunto de campos indexados se repita en la tabla. Ya dijimos que un índice es como una tabla auxiliar que sólo contiene ciertas columnas de búsqueda. Por eso también es posible (y recomendable) indicar tanto el tablespace como las cláusula STORAGE para las características de almacenamiento de disco. Si no se incluyera, se utilizará el STORAGE indicado en la creación del tablespace sobre el que se crea el índice.

Así mismo Oracle recomienda que los índices residan en un tablespace separado al de las tablas. Esto es debido a la siguiente razón: Dos tablespaces distintos están soportados físicamente por al menos un datafile cada uno. Si nuestro servidor de base de datos tiene más de un disco duro (algo muy normal), es posible crear un tablespace con sus datafiles en un disco y otro tablespace con los datafiles en otro disco. Esto permite que se puedan hacer lecturas de disco simultáneamente sobre dos disco físicos, ya que cada disco tiene su propio bus de datos. Al meter los índices en un disco físico y los datos en otro, se facilita que se puedan hacer lecturas simultaneas. Este proceso (de poner los índices y datos en discos separados), se denomina balanceado.

Oracle crea automáticamente un índice cuando se define la clave primaria. Esto es porque la condición más habitual en una consulta a cualquier tabla es por los campos de su clave primaria. De esta forma se aceleran la gran mayoría de las consultas (recordar que un índice actúa del mismo modo que el de un libro).

Pero pueden darse casos en los que se hagan gran cantidad de consultas por campos distintos a los de la clave primaria. En este caso es necesario crear un índice por los campos por lo que se accede. Por ejemplo, puede ser que en nuestra tabla FACTURA sea muy común recuperar aquellas facturas de un cierto cliente. En este caso la consulta SELECT ha realizar sería la siguiente:

SELECT *
FROM FACTURA
WHERE C_PAIS = 1 AND C_CLIENTE = ‘A111’;

En este caso se está accediendo la tabla FACTURA por campos distintos a la clave primaria (que es Referencia). Si este tipo de consultas son muy habituales es necesario crear un índice por estos campos:

CREATE INDEX ind_factura_cliente
ON FACTURA( C_PAIS, C_CLIENTE ) TABLESPACE tab_factura_ind
STORAGE( INITIAL 500K NEXT 500K );

No podemos poner la cláusula UNIQUE porque si no, no podríamos insertar más de una factura por cliente.

CREATE VIEW

Una vista (view) es una consulta SELECT almacenada en base de datos con un cierto nombre. Si tenemos la siguiente consulta:

SELECT C.D_CLIENTE, SUM( F.IMPORTE )
FROM	FACTURA F, CLIENTE C
WHERE  F.C_PAIS	= C.C_PAIS AND F.C_CLIENTE = C.C_CLIENTE
GROUP BY F.C_PAIS, F.C_CLIENTE, C.D_CLIENTE;

Si esta consulta es necesario ejecutarla muchas veces, entonces podemos guardar esta definición en base de datos con un nombre (crear una vista), y después hacer la consulta sobre la vista.

CREATE VIEW TOTAL_FACTURA_CLIENTE AS SELECT C.D_CLIENTE, SUM( F.IMPORTE ) FROM	FACTURA F, CLIENTE C
WHERE  F.C_PAIS	= C.C_PAIS AND F.C_CLIENTE = C.C_CLIENTE
GROUP BY F.C_PAIS, F.C_CLIENTE, C.D_CLIENTE;

Y después hacer la consulta sobre la vista:

SELECT *
FROM TOTAL_FACTURA_CLIENTE;

La sintaxis de creación de vista es:

CREATE {OR REPLACE} {FORCE} VIEW nombre_vista AS Subconsulta;

La cláusula OR REPLACE permite sobrescribir una definición existente con otra nueva definición. La cláusula FORCE permite crear una vista aunque las tablas de la subconsulta no existan.

Ejemplo:

CREATE OR REPLACE FORCE VIEW VISTA_INCORRECTA AS SELECT * FROM FACTURA_ADICIONAL;
 
CREATE OR REPLACE VIEW FACTURA_CLIENTE_A111 AS SELECT * FROM FACTURA
WHERE C_PAIS = 1 AND C_CLIENTE = ‘A111’;

CREATE SEQUENCE

Una secuencia (sequence) es un objeto de base de datos que genera números secuenciales. Se suele utilizar para asignar valores a campos autonuméricos.

En realidad una secuencia no es más que una tabla con una columna numérica en la que se almacena un valor. Cada vez que se consulta la secuencia se incrementa el número para la siguiente consulta.

Sintaxis:

CREATE SEQUENCE nombre_secuencia
{START WITH entero}
{INCREMENT BY entero}
{MAXVALUE entero | NOMAXVALUE}
{MINVALUE entero | NOMINVALUE }
{CYCLE | NOCYCLE};

• La cláusula START WITH define el valor desde el que empezará la generación de números. Si no se incluye, se empezará a partir de MINVALUE. • La cláusula INCREMENT BY indica la diferencia que habrá entre un número y el siguiente. Puede ser cualquier número entero (positivo o negativo) distinto de 0. • La cláusula MAXVALUE indica el valor máximo que podrá alcanzar la secuencia. Se podrá incluir la cláusula NOMAXVALUE para no definir máximo de 1027. • La cláusula MINVALUE indica el valor mínimo de la secuencia. Se podrá incluir la cláusula NOMINVALUE para definir un mínimo de –1026. La cláusula CYCLE permite que se empiece a contar en MINVALUE cuando se llegue a MAXVALUE. Por defecto las secuencias se crean NOCYCLE.

Ejemplos:

CREATE SEQUENCE REF_FACTURA START WITH 1
INCREMENT BY 1
MAXVALUE 999999
MINVALUE 1;
 
CREATE SEQUENCE COD_CLIENTE INCREMENT BY 10;
 
CREATE SEQUENCE COD_PAIS INCREMENT BY 10
CYCLE;

Acceso a secuencias:

Las secuencias al ser tablas se acceden a través de consultas SELECT. La única diferencia es que se utilizan pseudocolumnas para recuperar tanto el valor actual como el siguiente de la secuencia. Al ser pseudocolumnas se puede incluir en el FROM cualquier tabla o bien la tabla DUAL.

Nombre_secuencia.CURRVAL: retorna el valor actual de la secuencia. Nombre_secuencia.NEXTVAL: incrementa la secuencia y retorna el nuevo valor. Ejemplos:

CREATE SEQUENCE REF_FACTURA START WITH 1
INCREMENT BY 1
MAXVALUE 999999
MINVALUE 1;
 
CREATE SEQUENCE COD_CLIENTE INCREMENT BY 10;
 
CREATE SEQUENCE COD_PAIS INCREMENT BY 10
CYCLE;
 
 
SELECT REF_FACTURA.CURRVAL FROM DUAL;
 
SELECT COD_CLIENTE.NEXTVAL FROM DUAL;
 
SELECT COD_CLIENTE.NEXTVAL, D_CLIENTE FROM CLIENTE;
 
UPDATE CLIENTE
SET CODIGO = SECUENCIA_CLIENTE.NEXTVAL;
 
INSERT INTO CLIENTE
VALUES( SECUECIA_CLIENTE.NEXTVAL, ‘Juancito Pérez Pí’ );

SENTENCIAS DROP

Toda sentencia de creación CREATE tiene su equivalente para eliminar el objeto creado.

Todas estas sentencias tienen la misma sintaxis:

DROP tipo_objeto objeto_a_borrar.

Ejemplos:

DROP TABLE FACTURA;
 
DROP SEQUENCE COD_CLIENTE; 
DROP SYNONYM BILL;
DROP VIEW TOTAL_FACTURA_CLIENTE; DROP TABLESPACE tab_indices;

Ciertas sentencias DROP (como DROP TABLE o DROP TABLESPACE) tienen cláusulas adicionales para ciertas situaciones especiales. Para más información buscar la ayuda de la sentencia necesitada en el Oracle SQL Reference.

SENTENCIAS ALTER

Al igual que existe una sentencia DROP para cada objeto creado, también existe una sentencia ALTER para cada objeto de base de datos. Con estos tres grupos de sentencias se hace la gestión completa de los objeto: creación, modificación y borrado.

La sintaxis básica de las sentencias ALTER es:

ALTER tipo_objeto nombre_objeto Cláusulas específicas de cada tipo de ALTER;

Las cláusulas propias de cada sentencia ALTER son muchas y variadas, por lo que aquí no se citarán más que ciertos ejemplos. Para más información dirigirse la ayuda de la sentencia necesitada en el Oracle SQL Reference.

Ejemplos:

ALTER TABLE FACTURA ADD(
NUEVA_COLUMNA  VARCHAR2(10) NOT NULL ); 
ALTER VIEW BILL COMPILE;
ALTER SEQUENCE NOCYCLE;

LA SENTENCIA TRUNCATE

La sentencia TRUNCATE pertenece al conjunto de las sentencias DDL, y permite vaciar todos los registros de una tabla. Aparentemente es equivalente a hacer un DELETE sin condición, pero en realidad no es igual, ya que DELETE pertenece al subconjunto de DML y TRUNCATE al DDL.

La sintaxis básica es:

TRUNCATE nombre_tabla {DROP|REUSE STORAGE}

La cláusula DROP STORAGE eliminará todas las extents creadas durante la vida de la tabla.

Ejemplos:

TRUNCATE FACTURA DROP STORAGE; 
TRUNCATE CLIENTE;

Funciones SQL

Las funciones SQL permiten mostrar columnas calculadas dentro de sentencias DML (SELECT, INSERT, DELETE y UPDATE).

Funciones de tratamiento numérico

Función Descripción
ABS( n ) Retorna el valor absoluto del parámetro.
CEIL( n ) Retorna el entero mayor del parámetro.
FLOOR( n ) Retorna el entero menor del parámetro.
MOD( m,n ) Retorna el resto de la división m/n
POWER( m,n ) Retorna mn
ROUND( m[,n] ) Retorna m, redondeado a n decimales. Si m se omite es 0.
SIGN( n ) Retorna 1 si n es positivo, -1 si negativo y 0 si es 0.
TRUNC( n[,m] ) Trunca un número a m decimales. Si m se omite es 0.

Funciones de tratamiento alfanumérico

Función Descripción
CHR( n ) Retorna el carácter equivalente al código n en la tabla de conjunto de caracteres utilizado (ASCII, UNICODE…)
CONCAT( s1, s2 ) Concatena dos cadenas de caracteres. Equivalente al operador
INITCAP( s ) Pasa el mayúscula la primera letra de cada palabra
LOWER( s ) Pasa a minúsculas toda la cadena de caracteres
LPAD( s, n ) Retorna los n primeros caracteres de la cadena s.
RPAD( s, n ) Retorna los n últimos caracteres de la cadena s.
LTRIM( s1[, s2] ) Elimina todas las ocurrencias de s2 en s1 por la izquierda. Si se omite s2, se eliminarán los espacios.
RTRIM( s1[, s2] ) Elimina todas las ocurrencias de s2 en s1 por la derecha. Si se omite s2, se eliminarán los espacios.
REPLACE( s1, s2, s3 ) Retorna s1 con cada ocurrencia de s2 reemplazada por s3.
SUBSTR( s, m, n ) Retorna los n caracteres de s desde la posición m.
UPPER( s ) Pasa a mayúsculas toda la cadena de caracteres
LENGTH( s ) Retorna la longitud (en caracteres) de la cadena pasada.

Funciones de tratamiento de fechas

Función Descripción ADD_MONTHS( d, n ) Suma un número (positivo o negativo) de meses a una fecha. LAST_DAY( d ) Retorna el ultimo día de mes de la fecha pasada. MONTHS_BETWEEN( d1, d2 ) Retorna la diferencia en meses entre dos fechas. ROUND( d, s ) Redondea la fecha d según el formato indicado en s. (*) TRUNC( d, s ) Trunca la fecha d según el formato indicado en s. (*)

Formatos para ROUND y TRUNC para fechas:

Formato Descripción ‘MONTH’, ‘MON’, ‘MM’ Principio de mes ‘DAY’, ‘DY’, ‘D’ Principio de semana ‘YEAR’, ‘YYYY’, ‘Y’ Principio de año

Funciones de grupo

Estas funciones actúan sobre un conjunto de valores, retornando sólo un registro.

Función Descripción SUM( valores ) Retorna la suma. AVG( valores ) Retorna la media aritmética MAX( valores ) Retorna el máximo. MIN( valores ) Retorna el mínimo COUNT(valores|* ) Retorna la cuenta. Todas estas funciones permite incluir el modificador DISTINCT delante de la lista de valores para que omita los repetidos.

Funciones de conversión

Función Descripción CHARTOROWID( s ) Convierte una cadena en tipo de dato ROWID. ROWIDTOCHAR( rowid ) Convierte un tipo de dato ROWID en cadena de caracteres. TO_CHAR( *[, s] ) Convierte el tipo de dato * en cadena de caracteres. Si * es una fecha, se podrá utilizar la cadena s como formato de conversión. TO_DATE( s1[, s2] ) Convierte la cadena s1 en fecha, conforme al formato de convesión s2. TO_NUMBER( s ) Convierte una cadena de caracteres en valor numérico.

Otras funciones

Función Descripción DUMP( columna ) Retorna información de almacenamiento para la columna indicada. GREATEST( expr1, expr2, … exprN ) Retorna la expresión mayor. LEAST( expr1, expr2, … exprN ) Retorna la expresión menor. NVL( expr1, expr2 ) Retorna expr2 si expr1 es NULL, sino retorna expr1. USEREVN( s ) Retorna opciones de entorno de la sesión activa: Los valores para s pueden ser: • ‘ISDBA’: Retorna ‘TRUE’ si el usuario activo tiene el rol DBA. • ‘LANGUAGE’: Idioma activo. • ‘TERMINAL’: Nombre de terminal donde se realiza la consulta. • ‘SESSIONID’: Número de sesión activa. DECODE( expr_ev, Caso_1, ret_1, Caso_2, ret_2, … Caso_N, ret_N, Caso_else ) Permite hace una evaluación de valores discretos. Es similar a la estructura switch de C/C++ o case of de Pascal. Ejemplo: DECODE( COLOR, ‘R’, ‘Rojo’, ‘V’, ‘Verde’, ‘A’, ‘Azul’, ‘Color desconocido’ )

Control de transacciones

Debido a que en las operaciones normales con la base de datos puede corromper la información, todas las bases de datos tiene un sistema de control de transacción.

Se denomina transacción al espacio de tiempo que hay desde que se hace la primera sentencia DML que no sea SELECT (INSERT, UPDATE, DELETE), hasta que damos por finalizada la transacción explícitamente (con las sentencias apropiadas) o implícitamente (terminando la sesión).

Durante la transacción, todas las modificaciones que hagamos sobre base de datos, no son definitivas, más concretamente, se realizan sobre un tablespace especial que se denomina tablespace de ROLLBACK, o RBS (RollBack Segment). Este tablespace tiene reservado un espacio para cada sesión activa en el servidor, y es en ese espacio donde se almacenan todas las modificaciones de cada transacción. Una vez que la transacción se ha finalizado, las modificaciones temporales almacenadas en el RBS, se vuelcan al tablespace original, donde está almacenada nuestra tabla. Esto permite que ciertas modificaciones que se realizan en varias sentencias, se puedan validar todas a la vez, o rechazar todas a la vez.

Las sentencias de finalización de transacción son:

COMMIT: la transacción termina correctamente, se vuelcan los datos al tablespace original 
        y se vacía el RBS. 
ROLLBACK: se rechaza la transacción y el vacía el RBS.

Ejemplo de transacción:

Histórico de sentencias:

SELECT;
SELECT; SELECT; UPDATE; SELECT; INSERT; UPDATE;
SELECT; UPDATE; COMMIT;	
Transacción

Si nuestro número de sentencias es tan grande que el RBS se llena, Oracle hará un ROLLBACK, por lo que perderemos todos los datos. Así que es recomendable hacer COMMIT cada vez que el estado de la base de datos sea consistente.

Si terminamos la sesión con una transacción pendiente, Oracle consultará el parámetro AUTOCOMMIT, y si éste está a TRUE, se hará COMMIT, si está FALSE se hará ROLLBACK;

Programación PL/SQL

PL: El lenguaje de programación para SQL

Ya dijimos en los primeros capítulos que SQL es un lenguaje de comandos, no un lenguaje de programación con todas las estructuras de control típicas. Así, SQL sólo contempla instrucciones, más o menos simples, pero no tiene ningún tipo de instrucciones de control de flujo o de otro tipo más propias de los lenguajes de programación 3GL. Para subsanar esta carencia, Oracle definió un lenguaje de programación de tercera generación, que admitía sentencias SQL embebidas. Este lenguaje se llama PL/SQL (Programming Language/SQL)

La idea básica sobre la que se sustenta el PL/SQL es aplicar las estructuras típicas de un lenguaje de programación (bifurcaciones, bucles, funciones…) a las sentencias SQL típicas.

Así podemos tener el siguiente pseudocódigo:

Sentencia SELECT que recupera el total de sueldos

Si el total de sueldos > 1.000.000
   Sentencia UPDATE que incrementa un 10% los sueldos
Si no
    Sentencias UPDATE que incrementa un 5% los sueldos
Fin-si

Estructura básica en PL/SQL: El bloque de código

Cuando se escribe código en PL/SQL, este debe estar agrupado en unidades denominadas “bloques de código”. Un bloque de código puede contener otros sub-bloques de código y así sucesivamente.

Un bloque de código queda delimitado por las palabras reservadas BEGIN y END. Por ejemplo:

BEGIN
  Sentencias . . . 
  Sentencias . . . 
  Sentencias . . .
BEGIN
  Sentencias . . . 
  Sentencias . . . 
   Sentencias . . .
END;
   Sentencias . . .
   Sentencias . . . 
   Sentencias
END;

En este ejemplo podemos ver que hay un bloque de código externo que contiene un bloque de código interno. Un bloque de código opcionalmente puede contar con las siguientes secciones:

DECLARE
 
   Declaración de VARIABLES
 
BEGIN
 
   Sentencias SQL y PL/SQL
 
EXCEPTION
 
   Manejadores de excepciones
 
END;

La única sección obligatoria es la contenida dentro de BEGIN y END;

Comentarios

Los comentarios pueden ser multilínea encerrados entre /* y */ o monolínea, que comienzan por –

Declaración de variables

Las variables deben declararse dentro de la sección DECLARE y deben seguir la siguiente sintaxis:

Nombre_de_variable {CONSTANT} TIPO {:= inicialización};

Los tipos posibles son todos aquellos válidos para SQL añadiendo algunos propios de PL/SQL. Para más información sobre los tipos propios de PL/SQL consultar el PL/SQL User’s Guide and Reference

Ejemplos:

Interes NUMBER(5,3); Descripcion VARCHAR2(50) := ‘inicial’; Fecha_max DATE; Contabilizado BOOLEAN := TRUE; PI CONSTANT REAL := 3.14159

Estructuras básicas de control

Como PL/SQL es un lenguaje 3GL, cuenta con las estructuras típicas de control de flujo: bifurcaciones condicionales y bucles:

Bifurcaciones condicionales:

La sintaxis básica es:

IF condición_1 THEN
Se ejecuta si se cumple condicion_1
ELSIF condicion_2 THEN – la palabra reservada es ELSIF y no es ELSEIF 
Se ejecuta si no se cumple condicion_1 y se cumple condicion_2
ELSE
Se ejecuta si no se cumple condicion_1 ni condicion_2
END IF;

Como en cualquier lenguaje de programación, las estructuras IF se pueden anidar unas dentro de otras.

Bucles Existen varias variantes de la estructura bucle. La más sencilla es la siguiente:

LOOP
   sentencias
END LOOP;

Las sentencias de dentro del bucle se ejecutarán durante un número indefinido de vueltas, hasta que aparezca la instrucción EXIT; que finalizará el bucle. Este tipo de bucle se denomina bucle incondicional. Otra opción es incluir la estructura EXIT WHEN condición, se terminará el bucle cuando la condición se cumpla:

LOOP Sentencias
   EXIT WHEN condicion; 
      Sentencias
END LOOP;

El bucle anterior es equivalente al siguiente:

LOOP 
  Sentencias
   IF condicion THEN EXIT;
    END IF;

   Sentencias
END LOOP;	

Un tipo de bucle más común son los bucles condicionales:

WHILE condicion LOOP 
   Sentencias
END LOOP;

Y por último el bucle FOR:

FOR contador IN {REVERSE} limite_inferior..limite_superior LOOP
   sentencias
END LOOP;

Contador deberá ser una variable de tipo numérico que sea capaz de contener los valores comprendidos entre limite_inferior y limite_superior. Limite_inferior y limite_superior deberán ser expresiones numéricas, ya sean constantes (1,10…) o funciones (ROUND(max,0), ASCII(‘A’)…)

Si la variable contador no está definida, PL/SQL definirá una variable de tipo INTEGER al iniciar el bucle, y la liberará al finalizar el bucle.

Registros y tablas

Existen dos tipos de datos que no hemos mencionado anteriormente: los registros (o estructuras) y las tablas (o arrays o vectores).

Los dos tipos deben ser definidos en un como un nuevo tipo antes de declarar variables de ese nuevo tipo. El modo de definir nuevos tipos de variables en PL/SQL es a través de la palabra reservada TYPE:

TYPE nuevo_tipo IS tipo_original.

Una vez definido en nuevo tipo, ya se pueden definir variables de ese nuevo tipo:

Una_variable nuevo_tipo;

Registros:

Los registros no son más que agrupaciones de tipos de variables que se acceden con el mismo nombre.

La sintaxis de definición de registros es:

TYPE nombre_registro IS RECORD( Campo1  tipo,
Campo2  tipo, Campo3  tipo );

Por ejemplo:

TYPE alumno IS RECORD( n_alumno	VARCHAR2(5), nombre	VARCHAR2(25), 
apellido_1  VARCHAR2(25), apellido_2  VARCHAR2(25), tlf	VARCHAR2(15) );

Tablas:

Una tabla no es más que una colección de elementos identificados cada uno de ellos por un índice. En muchos lenguajes se les denomina arrays.

La sintaxis de definición de tablas es:

TYPE nombre_tabla IS TABLE OF tipo_de_elementos;

El tamaño de la tabla se define durante la declaración de la variable

Nombre_variable nombre_tabla := nombre_variable( lista de elementos );

Por ejemplo:

DECLARE
 
TYPE array_enteros IS TABLE OF INTEGER;
Un_array  array_enteros := array_enteros( 0, 0, 0, 0 );
 
BEGIN
END;

El ejemplo anterior define un tipo de array de enteros y después declara una variable de ese tipo, inicializándola a 4 elementos (todos con 0).

Excepciones

Anteriormente dijimos que un bloque de código puede contener una sección denominada EXCEPTION. Esta sección es la encargada de recoger todas las anomalías que se puedan producir dentro del bloque de código.

Una excepción es una situación especial dentro de la ejecución de un programa, que puede ser capturada para asignar un nuevo comportamiento. Una excepción puede ser un error de ejecución (una división entre 0) o cualquier otro tipo de suceso.

Las excepciones deben ser declaradas dentro de la sección DECLARE, como si de una variable se tratasen:

DECLARE
e_sin_alumnos  EXCEPTION;

Una vez que la excepción está definida, ésta debe ser lanzada, ya sea automáticamente por Oracle, o lanzada manualmente a través de la instrucción RAISE.

SELECT COUNT(*) INTO num_alumnos;
 
IF num_alumnos = 0 THEN RAISE e_sin_alumnos;
END IF;

Una vez que la excepción ha sido lanzada, la ejecución continua en la sección EXCEPTION, concretamente en el manejador apropiado (o el manejador WHEN OTHERS cuando no exista el específico).

Un manejador de excepciones es una sub-sección dentro de la sección EXCEPTION que se encarga de capturar una excepción concreta.

La sintaxis para escribir manejadores es:

EXCEPTION
WHEN <excepción> THEN
 
WHEN <otra_excepción> THEN WHEN OTHERS THEN
END;

Las líneas de código debajo del manejador específico se ejecutarán cuando esa excepción se produzca. Un ejemplo completo:

DECLARE
e_sin_alumnos  EXCEPTION;
 
num_alumnos	NUMBER(5); BEGIN
SELECT COUNT(*)
INTO num_alumnos;
 
 
IF num_alumnos = 0 THEN
RAISE e_sin_alumnos; END IF;
 
EXCEPTION
WHEN e_sin_alumno
INSERT INTO ERROR( FECHA, DESCRIPCION )
VALUES( SYSDATE, ‘No se han encontrado alumnos en la tabla ALUMNO.);
 
WHEN OTHERS
Raise_application_error( -20000, ‘Error en bloque de codigo PL/SQL’ );
-- este error se transmite a la aplicación que llame a este bloque de código (PL/SQL,
-- Java, C/C++, etc.) 
 
END;

Anteriormente habíamos dicho que las excepciones puede lanzarse automáticamente o manualmente a través de la instrucción RAISE.

Algunas excepciones se lanzarán automáticamente cuando se produzcan ciertos tipos de errores en la ejecución del bloque de código. Cada excepción automática tiene asociado un código de error ORA-XXXX el cual si se produce, hará que se lance la excepción correspondiente.

A continuación se muestra una lista de las excepciones automáticas predefinidas por Oracle:

Excepción Error Oracle
ACCESS_INTO_NULL ORA-06530
COLLECTION_IS_NULL ORA-06531
CURSOR_ALREADY_OPEN ORA-06511
DUP_VAL_ON_INDEX ORA-00001
INVALID_CURSOR ORA-01001
INVALID_NUMBER ORA-01722
LOGIN_DENIED ORA-01017
NO_DATA_FOUND ORA-01403
NOT_LOGGED_ON ORA-01012
PROGRAM_ERROR ORA-06501
ROWTYPE_MISMATCH ORA-06504
STORAGE_ERROR ORA-06500
SUBSCRIPT_BEYOND_COUNT ORA-06533
SUBSCRIPT_OUTSIDE_LIMIT ORA-06532
TIMEOUT_ON_RESOURCE ORA-00051
TOO_MANY_ROWS ORA-01422
VALUE_ERROR ORA-06502
ZERO_DIVIDE ORA-01476

Cursores

Cuando dentro de un intérprete SQL escribimos una consulta SELECT, el intérprete nos muestra las distintas filas de resultados para que podamos verlas. Sin embargo, dentro de un lenguaje de programación tenemos un problema, ya que lo más común no es mostrar el resultado, sino almacenarlo en variables para su posterior tratamiento.

Ahora tenemos que dividir el problema en dos partes, dependiendo del número de filas que nos retorna la consulta SELECT:

 Si retorna cero o una fila: El valor se podrá almacenar en tantas variables como columnas 
 consultadas. Es decir, si escribimos un SELECT de tres columnas, y sólo retorna una fila 
 (matriz 1x3), podremos almacenar el valor dentro de tres variables definidas para este uso.

El modo de hacer esto en PL/SQL es:

SELECT col1, col2, col3
INTO	var1, var2, var3
FROM	TABLA;

De este modo se almacenará en las variables var1, var2 y var3 los valores recuperados por la consulta SELECT o NULL si esta consulta no retorna ninguna fila.

 Si retorna más de una fila: En este caso no es posible almacenar directamente los 
 valores en variables. Para ello existen los cursores, que no son más que consultas 
 SELECT que se recuperar fila a fila y no todo su conjunto de resultados a la vez.

De las maneras que tiene PL/SQL para tratar el tema de los cursores, el más sencillo y seguro son los cursores implícitos, puesto que al no tener que declararlos son más sencillos, no se tiene que estar pendiente del cierre, del control de las excepciones, que pueden dejar los cursores abiertos, etc.

A continuación se describe la forma de utilizar un cursor implícito en PL/SQL:

FOR <contador> IN <SELECT….> LOOP
   Sentencias;
END LOOP;

Ejemplo:

DECLARE
vn_ID_ALUMNO	NUMBER(5); 
vv_NOMBRE        VARCHAR2(30);
BEGIN
 
FOR I IN (SELECT ID_ALUMNO, NOMBRE FROM ALUMNOS) LOOP
 
		vn_ID_ALUMNO := i.ID_ALUMNO;
       vv_NOMBRE :=i.NOMBRE;
       .
       . 
       .
 
END LOOP
 
EXCEPTION
WHEN OTHERS
 
END;

Funciones, procedimientos y paquetes:

Una vez que tenemos escrito un bloque de código, podemos guardarlo en un fichero .SQL para su posterior uso, o bien guardarlo en base de datos para que pueda ser ejecutado por cualquier aplicación.

A la hora de guardar un bloque de código hay que tener en cuenta ciertas normas:

1.- Palabra reservada DECLARE desaparece

2.- Podremos crear procedimientos y funciones. Los procedimientos no podrán retornar ningún valor, mientras que las funciones deben retornar un valor de un tipo de dato básico.

Para crear un procedimiento (stored procedure: procedimiento almacenado) usaremos la siguiente sintaxis:

CREATE {OR REPLACE} PROCEDURE nombre_proc( tipo_dato param1, tipo dato_param2... ) IS
 
<Sección DECLARE> 
BEGIN
{EXCEPTION} 
END;

Para crear una función usaremos la siguiente sintaxis:

CREATE {OR REPLACE} FUNCTION nombre_func( tipo_dato param1, tipo dato_param2... ) RETURN tipo_dato IS

<Sección DECLARE> 
BEGIN
{EXCEPTION}
END;

Una vez que tenemos creados nuestros procedimientos y funciones podemos almacenarlos dentro de librerías de funciones. Estas librerías tienen el nombre de paquetes o packages.

Un paquete puede contener procedimientos, funciones, variables, tipos y subtipos, en general, cualquier objeto que se pueda declarar dentro de la sección DECLARE de un bloque de código.

La creación de un paquete pasa por dos fases:

1.- Crear la cabecera del paquete donde se definen que procedimientos, funciones, variables, etc. Contendrá el paquete.

2.- Crear el cuerpo del paquete, donde se definen los bloques de código de las funciones y procedimientos definidos en la cabecera del paquete.

Para crear la cabecera del paquete utilizaremos la siguiente instrucción:

CREATE {OR REPLACE} PACKAGE nombre_de_paquete IS < declaraciones > END;

Para crear el cuerpo del paquete utilizaremos la siguiente instrucción:

CREATE {OR REPLACE} PACKAGE BODY nombre_paquete IS

< Bloques de código> END;

Hay que tener en cuenta que toda declaración de función o procedimiento debe estar dentro del cuerpo del paquete, y que todo bloque de código contenido dentro del cuerpo debe estar declarado dentro de la cabecera de paquete.

Cuando se quiera acceder a las funciones, procedimientos y variables de un paquete se debe anteponer el nombre de este:

Nombre_paquete.función(x) Nombre_paquete.procedimiento(x) Nombre_paquete.variable

Oracle define los siguientes paquetes de funciones predefinidos:

DBMS_ALERT
DBMS_APPLICATION_INFO 
DBMS_AQ
DBMS_AQADM 
DBMS_DDL 
DBMS_DEFER 
DBMS_DEFER_QUERY 
DBMS_DEFER_SYS 
DBMS_DESCRIBE 
DBMS_JOB
DBMS_LOB 
DBMS_LOCK
DBMS_OUTPUT 
DBMS_PIPE 
DBMS_REFRESH 
DBMS_REPCAT 
DBMS_REPCAT_ADMIN 
DBMS_REPCAT_AUTH 
DBMS_ROWID 
DBMS_SESSION 
DBMS_SHARED_POOL 
DBMS_SNAPSHOT 
DBMS_SQL 
DBMS_UTILITY UTL_FILE

Para más información sobre PL/SQL consultar el Oracle PL/SQL User’s Guide and Reference

Disparadores

Los disparadores (o triggers) son bloques de código almacenados en base de datos y que se ejecutan automáticamente. Un disparador está asociado a una tabla y a una operación DML específica (INSERT, UPDATE o DELETE). En definitiva, los disparadores son eventos a nivel de tabla que se ejecutan automáticamente cuando se realizan ciertas operaciones sobre la tabla.

Para crear un disparador utilizaremos la siguiente instrucción:

CREATE {OR REPLACE} TRIGGER nombre_disp
[BEFORE|AFTER|INSTEAD OF] [DELETE|INSERT|UPDATE {OF columnas}] ON tabla
{DECLARE} 
BEGIN
{EXCEPTION}
 END;

Para más información sobre los disparadores consultar el Oracle SQL Reference

Jobs

Los Jobs, son la forma que tiene Oracle de planificar trabajos. Están almacenados en la base de datos y se ejecutan automáticamente. Un Job es un objeto independiente, y puede ejecutar tanto una función o procedimiento almacenado como una sentencia SQL o un Bloque de PL/SQL.

Para crear un Job utilizaremos la siguiente instrucción:

 
DECLARE
  X NUMBER;
BEGIN
  SYS.DBMS_JOB.SUBMIT
    ( job       => X 
     ,what      => '<Sentancia(s) a Ejecutar>'
     ,next_date => TO_DATE('<Fecha y hora de la siguiente ejecución>','dd/mm/yyyy hh24:mi:ss')
     ,INTERVAL  => '<Intervalo de tiempo>'
     ,no_parse  => TRUE
     ,INSTANCE  => 1
     ,FORCE     => TRUE
    );
  SYS.DBMS_OUTPUT.PUT_LINE('Job Number is: ' || TO_CHAR(x));
END;
/
 
COMMIT;

El catálogo de Oracle

Oracle cuenta con una serie de tablas y vistas que conforman una estructura denominada catálogo. La principal función del catálogo de Oracle es almacenar toda la información de la estructura lógica y física de la base de datos, desde los objetos existentes, la situación de los datafiles, la configuración de los usuarios, etc.

El catálogo sigue un estándar de nomenclatura para que su memorización sea más fácil:

Prefijos:

USER, ALL, DBA

Existe una tabla de catálogo para cada tipo de objeto posible. Su nombre aparecerá en plural

TABLES, VIEWS, SEQUENCES, TABLESPACES…

Sabiendo qué objetos existen, y qué prefijos podemos utilizar, ya podemos acceder a los objetos del catálogo de Oracle.

Ejemplos:

Objeto Descripción
DBA_TABLES Información para administradores de las tablas en base de datos.
USER_VIEWS Información de las vistas creadas por el usuario desde el que accedemos.
ALL_SEQUENCES Información de todas las secuencias existentes en base de datos.
DBA_TABLESPACES Información de administración sobre los tablespaces.
USER_TAB_COLUMNS Todas las columnas de tabla en el usuario activo.

Los objetos de catálogo también guardan relaciones entre ellos. Por ejemplo, el objeto ALL_TABLES guarda una relación 1-N con el objeto ALL_TAB_COLUMNS: Una tabla tiene N columnas.

Existe un pseudo usuario llamado PUBLIC el cual tiene acceso a todas las tablas del catálogo público. Si se quiere que todos los usuarios tengan algún tipo de acceso a un objeto, debe darse ese privilegio a PUBLIC y todo el mundo dispondrá de los permisos correspondientes.

El catálogo público son aquellas tablas (USER_ y ALL_) que son accesibles por todos los usuarios. Normalmente dan información sobre los objetos creados en la base de datos.

El catálogo de sistema (DBA_ y V_$) es accesible sólo desde usuarios DBA y contiene tanto información de objetos en base de datos, como información específica de la base de datos en sí (versión, parámetros, procesos ejecutándose…)

Ciertos datos del catálogo de Oracle están continuamente actualizados, como por ejemplo las columnas de una tabla. Cuando se crea una columna nueva se añade la entrada correspondiente al catálogo. Sin embargo hay otros datos que no pueden actualizarse en tiempo real porque penalizarías mucho el rendimiento general de la base de datos, como por ejemplo el número de registros de una tabla, el tamaño de los objetos, etc. Para actualizar el catálogo de este tipo de datos es necesario ejecutar una sentencia especial que se encarga de volcar la información recopilada al catálogo:

ANALYZE [TABLE|INDEX] nombre
[COMPUTE|ESTIMATE|DELETE] STATISTICS;

La cláusula COMPUTE hace un cálculo exacto de la estadísticas (tarda más en realizarse en ANALYZE), la cláusula ESTIMATE hace una estimación partiendo del anterior valor calculado y de un posible factor de variación y la cláusula DELETE borra las anteriores estadísticas.

La sentencia COMMENT

El catálogo público contiene ciertas tablas encargadas de almacenar información adicional sobre tablas, vistas y columnas. La información que se suele almacenar es información de análisis, valores posibles para las columnas y en general todo aquello que se haya concluido durante la etapa de análisis.

Las tablas existentes son:

Tabla Descripción
ALL_TAB_COMMENTS Contiene los comentarios para tablas y vistas.
ALL_COL_COMMENTS Contiene los comentarios para las columnas de tablas y vistas.

La información se debe almacenar en base de datos según la siguiente sintaxis:

COMMENT ON TABLE [tabla|vista] IS ‘texto’;

COMMENT ON COLUMN [tabla|vista].columna IS ‘texto’;

Una vez que esta información está en base de datos, se puede escribir procedimientos o scripts SQL que muestren la información para sacar informes de documentación de base de datos.

Tuning básico de SQL

Una de las tareas más importantes de las propias de un desarrollador de bases de datos es la de puesta a punto o tuning. Hay que tener en cuenta que las sentencias SQL pueden llegar a ser muy complejas y conforme el esquema de base de datos va creciendo las sentencias son más complejas y confusas. Por es difícil escribir la sentencia correcta a la primera. Por todo ello después de tener cada uno de los procesos escrito, hay que pasar por una etapa de tuning en la que se revisan todas las sentencias SQL para poder optimizarlas conforme a la experiencia adquirida.

Tanto por cantidad como por complejidad, la mayoría de las optimizaciones deben hacerse sobre sentencias SELECT, ya que son (por regla general) las responsables de la mayor pérdida de tiempos.

A continuación se dan unas normas básicas para escribir sentencias SELECT optimizadas.

  • Las condiciones (tanto de filtro como de join) deben ir siempre en el orden en que esté definido el índice. Si no hubiese índice por las columnas utilizadas, se puede estudiar la posibilidad de añadirlo, ya que tener índices de más sólo penaliza los tiempos de inserción, actualización y borrado, pero no de consulta.
  • Evitar la condiciones IN ( SELECT…) sustituyéndolas por joins.
  • Colocar la tabla que devuelve menor número de registros en el último lugar del FROM
  • Si en la cláusula WHERE se utilizan campos indexados como argumentos de funciones, el índice quedará desactivado.
  • Una condición negada con el operador NOT desactiva los índices
  • Una consulta cualificada con la cláusula DISTINCT debe ser ordenada por el servidor aunque no se incluya la cláusula ORDER BY.
  • Para escribir una condición de existencia no se hace un SELECT COUNT(*), se hace un SELECT 1
  • No se deben hacer SELECT *; SELECT a,b…
  • Bind: Paso de parámetros por referencias

Toda consulta SELECT se ejecuta dentro del servidor en varios pasos. Para la misma consulta, pueden existir distintos caminos para conseguir el mismo resultado, por lo que el servidor es el responsable de decidir qué camino seguir para conseguir el mejor tiempo de respuesta. La parte de la base de datos que se encarga de estas decisiones se llama Optimizador. El camino seguido por el servidor para la ejecución de una consulta se denomina “Plan de ejecución” En Oracle existen dos optimizadores para la decisión del plan de ejecución:

  1. Optimizador por reglas (RULE): se basa en ciertas reglas para realizar las consultas. Por ejemplo, si se filtra por un campo indexado, se utilizará el índice. Si la consulta contiene un ORDER BY, se utilizará un algoritmo Quick Sort, etc. No tiene en cuenta el estado actual de la base de datos, ni el número de usuarios conectados, ni la carga de datos de los objetos, etc. Es un sistema de optimización estático, no varía de un momento a otro. Es un tipo de optimización que puede considerarse obsoleto, puesto que en Oracle 10 se desaconseja su uso y en Oracle 11 desaparecerá.
  1. Optimizador por costes (CHOOSE): se basa en las reglas básicas, pero teniendo en cuenta el estado actual de la base de datos. Es decir, tiene en cuenta el número de registros de las tablas, el número de usuarios accediendo a ellas, etc. Por ejemplo, si se hace una consulta utilizando un campo indexado, mirará primero el número de registros y si es suficientemente grande entonces merecerá la pena acceder por el índice, si no, accederá directamente a la tabla.

Para averiguar el estado actual de la base de datos se basa en los datos del catálogo público, por lo que es recomendable que esté lo más actualizado posible (a través de la sentencia ANALYZE), ya que de no ser así, se pueden tomar decisiones a partir de datos desfasados (la tabla tenía 10 registros hace un mes pero ahora tiene 10.000).

Plan de ejecución

Aunque en la mayoría de los casos no hace falta saber cómo ejecuta Oracle las consultas, existe una sentencia especial que nos permite ver esta información.

Básicamente se trata en rellenar una tabla especial (llamada PLAN_TABLE) con los un registro para cada paso en el plan de ejecución.

La tabla PLAN_TABLE debe tener la siguiente estructura (en Oracle)

CREATE TABLE PLAN_TABLE (
STATEMENT_ID		VARCHAR2 (30), 
TIMESTAMP		DATE,
REMARKS			VARCHAR2 (80), 
OPERATION		VARCHAR2 (30), 
OPTIONS			VARCHAR2(30), 
OBJECT_NODE		VARCHAR2(128), 
OBJECT_OWNER		VARCHAR2 (30), 
OBJECT_NAME		VARCHAR2 (30), 
OBJECT_INSTANCE		INTEGER, 
OBJECT_TYPE		VARCHAR2 (30), 
OPTIMIZER		VARCHAR2 (255), 
SEARCH_COLUMNS		INTEGER,
ID			INTEGER, 
PARENT_ID		INTEGER, 
POSITION			INTEGER, 
COST			INTEGER, 
CARDINALITY		INTEGER, 
BYTES			INTEGER,
OTHER_TAG		VARCHAR2 (255), 
OTHER			LONG);

Una vez que la tabla está creada en el usuario donde vamos a ejecutar la consulta, de debe ejecutar la siguiente sentencia:

EXPLAIN PLAN
SET STATEMENT_ID = ‘identificador de sentencia’ 
FOR <consulta SELECT a evaluar>;

El identificador de sentencia tiene que ser una cadena descriptiva para nuestra sentencia. Se utilizará más tarde para recuperar el plan entre todos los almacenados dentro de la consulta SELECT.

Esta sentencia lo que hará es almacenar en la tabla PLAN_TABLE un registro por cada paso en el plan de ejecución. El campos STATEMENT_ID de los pasos de nuestro plan de ejecución estará al valor indicado en ‘identificador de sentencia’.

Para mostrar el plan de ejecución se debe hacer un SELECT filtrando aquellos registros de nuestro plan de ejecución. Una sentencia típica que nos muestra el plan de ejecución formateado podría ser:

SELECT     ID, parent_id,
              LPAD (' ', 2 * (LEVEL - 1))
           || operation
           || ' '
           || options
           || ' '
           || object_name
           || ' '
           || DECODE(ID,0,'Cost = '|| POSITION) "Plan de consulta"
      FROM plan_table
START WITH ID = 0 AND STATEMENT_ID = 'identificador de sentencia'
CONNECT BY PRIOR ID = parent_id
           AND STATEMENT_ID = 'identificador de sentencia';

Trazas de ejecución

El modo de activar las trazas de ejecución es a través de SQL*Plus, con la instrucción Set auto trace ON/OFF

Una vez activada la auto-traza, toda sentencia ejecutada en SQL*Plus vendrá acompañada de su plan y estadísticas de ejecución.

Con la instrucción:

SET TIMING ON

Se activará el reloj interno de Oracle con el que se podrá cronometrar el tiempo de ejecución de cada consulta.

Tips & Tricks

  1. En un OLTP (Transaccional) no se deben crear índices bitmap, al haber gran volumen de transacciones, los índices bitmap no son óptimos.
  2. No deben haber más de 5 índices por cada tabla.
  3. Los índices deben ser discriminantes; Se dice que un índice es discriminante cuando una consulta por uno de sus valores no devuelve más de un 5% de los valores de la Tabla.
  4. Ojo con las consultas con muchas Joins, no se deben cruzar muchas tablas. Por el mismo motivo se deben utilizar las vistas con mucho cuidado, puesto que provocan que se crucen muchas tablas inadvertidamente.
  5. Al construir una Query se debe tener en cuenta el volumen de información que vamos a mover.
  6. Con grandes volúmenes de información, la desnomalización no está prohibida, se debe estudiar con detenimiento la conveniencia de ella.
  7. Índices en las claves foráneas:
  • Al crear un Clave primaria ya crea un índice único automáticamente.
  • Al crear un Clave foránea no lo crea.
  • Si no tenemos índice, al hacer un delete en la tabla padre o un update de su PK, como la FK tiene que mantener la integridad referencial, se recorrerá la tabla, por lo que es recomendable que lo haga por índice.
  • Si tenemos índice, los bloqueos los hará a nivel de registro y no de tabla.

Por Ejemplo en el siguiente esquema:

Si NO existieran los índices, en el momento que un usuario borrara un alumno o una asignatura, pararía lo siguiente:

  • Oracle debe mantener la Integridad referencial, por lo que tiene que recorrerse entera la tabla Alumno_Asignaturas.
  • Como no tiene índice, hace un Full Scan.
  • El bloqueo será a nivel de tabla y no lo liberará hasta que termine la transacción.

Apéndice A: Documentación Adicional

Oracle 9i SQL Reference, PL/SQL User's Guide and Reference:

Documentación de Oracle:

http://tahiti.oracle.com/

Oracle Corporation:

http://www.oracle.com http://otn.oracle.com


Discusión

, %2008/%09/%11 %03:%Sep:
, Calle 41 11 44, %2008/%10/%19 %23:%Oct:

OK. Gracias

, %2009/%12/%11 %21:%Dec:

Estoy muy agradecido por este tutorial de introduccion a la base de datos, me gustaria a prender mas con estos tutoriales a ver si me podrian ayudar y si podria recibir las siguientes clases de este curso en mi Email. muy a gradecido y que Dios les bendiga.

, %2010/%01/%04 %17:%Jan:

bueno bueno bueno =) Gracias por el aporte.

, Zacapa, Guatemala, %2010/%03/%07 %15:%Mar:

Exelente este tutorial de Oracle, muy liviano, me ha sido ùtil.

Enter your comment (wiki syntax is allowed):

Herramientas personales