Actualizado el 17/01/2017

icon Facebook icon Twiiter icon RSS icon EMAIL
  1. Portada
  2. >
  3. Opiniones
  4. >
  5. Big Data (4): ¿Por qué las bases de datos relacionales no sirven para todo?

Big Data (4): ¿Por qué las bases de datos relacionales no sirven para todo?

Escrito por Jordi Torres el 14/05/2013 a las 21:18:36
5936

(Professor UPC. BSC-CNS)

Hasta ahora, el escenario de las base de datos (BD) ha estado dominado por lo que se conoce como entornos SQL (lenguaje de consulta estructurado). Estas BD, que se suelen denominar relacionales, siguen las reglas llamadas  ACID (acrónimo inglés de atomicity, consistency, isolation, durability). Con estas propiedades las BD garantizan que un dato sea almacenado de manera inequívoca y con una relación definida sobre una estructura basada generalmente en tablas que contienen filas y columnas.

 

Pero en el escenario del Big Data mantener estas propiedades para un ingente número de datos plantea nuevos retos a las BD tradicionales. Por ejemplo pensemos en las nuevas aplicaciones en línea con miles de usuarios concurrentes y millones de consultas al día que requieren una gran velocidad de entrega de los datos para poder satisfacer tiempos de respuesta muy bajos. En estos casos, hoy por hoy una primera aproximación es poner los datos en memoria, lo que se conoce por In-Memory. Este tipo de entornos se verán pronto muy beneficiados por las mejoras en almacenamiento comentadas en el artículo anterior de esta serie.

 

Pero muchas de las nuevas aplicaciones requieren un volumen de muchos Terabytes de datos cuyo tamaño impide poder ser manejados con las BD tradicionales. Por eso han surgido las BD NoSQL, que permiten resolver los problemas de escalabilidad y rendimiento que presentan estos tamaños tan grandes, mediante nuevos entornos de manejo de datos distribuidos y escalables de forma horizontal (muchos discos en paralelos).

 

Para ello no queda más remedio que relajar algunas de las propiedades de las BD SQL que antes hemos mencionado. No tenemos espacio para entrar en detalle pero cojamos una como ejemplo: la consistencia.  En este caso, esta flexibilidad implica que la consistencia se dé, eventualmente, cuando no se hayan modificado los datos durante un periodo de tiempo. Es decir, en ciertos instantes dos consultas a la misma BD pueden devolver resultados diferentes. Para algunas aplicaciones esto es aceptable, por ejemplo imagínense que acaban de actualizar su muro de Facebook. Mientras se propaga esta actualización por su inmenso almacenamiento distribuido puede suceder que a algunos de sus amigos les llegue esta actualización más tarde que a otros.

 

Ahora bien, la aparición de las BD NoSQL no suponen la desaparición de las BD SQL, sino simplemente que hay soluciones mejores para determinados problemas y aplicaciones. Por eso, NoSQL también lo podemos leer como not only SQL, permitiendo además mantener y combinar los entornos SQL y NoSQL. La idea es que, para determinados escenarios, hay que relajar muchas de las limitaciones inherentes a las BD convencionales y la forma de acceder a ellas. Podemos pensar que las NoSQL son colecciones de documentos con campos definidos de manera laxa, que incluso pueden ir cambiando en el tiempo, en lugar de tablas con filas y columnas prefijadas. En cierto modo, incluso podríamos llegar a pensar que un sistema de este tipo no es ni siquiera una BD entendida como tal, sino un sistema de almacenamiento distribuido para gestionar datos dotados de una cierta estructura que puede ser enormemente flexible.

 

Sin duda este es un campo que durante el 2013 será muy activo, puesto que las principales empresas del sector ya han entrado en este nuevo y suculento mercado con numerosos productos disponibles.

 

Nos volvemos a encontrar en el siguiente artículo donde presentaremos como son los modelos de programación de estos entornos Big Data. Les agradezco sinceramente su tiempo y complicidad que me permiten disfrutar con pasión que es la divulgación tecnológica. Gracias.

 

 

Jordi Torres, experto en Big Data en la UPC Barcelona Tech y el Barcelona Supercomputing Center -www.JordiTorres.eu