¿Pueden las compañías de aguas gestionar el big data?

Lo cierto es que no, pero convendría matizar la respuesta.

Cada vez hay más dispositivos de monitorización, sobre todo en la red, que generan un volumen ingente de datos potencialmente útiles.

big data

Las compañías de aguas que lideran el sector de las redes inteligentes tienen instalados entre 10 y 12 sensores (presión, caudal, ruido y calidad del agua) por cada distrito hidromé.

Esta cifra puede parecer elevada para un sector que trabaja con datos desde hace relativamente poco, pero no es exagerada en el contexto del big data a nivel mundial.trico. Eso, para una compañía de aguas con dos millones de clientes y 1000 distritos hidrométricos, significa gestionar entre 10 000 y 12 000 sensores en un periodo de cinco años.

Fijémonos en las 3 uves del big data.

Volumen. 6000 millones de personas tienen teléfono móvil; una sola persona mirando contenidos en Facebook durante una hora consume unos 100 MB de datos móviles. Cada vehículo autónomo generará 4000 gigabytes de datos.  El año pasado el almacén de datos del CERN (colisionador de hadrones) acumuló más de 200 petabytes. El sistema EOSDIS (Earth Observing System Data and Information System) de la NASA tiene solo 9 petabytes de datos, aunque diariamente genera 6,4 terabytes de datos y distribuye casi 28 terabytes a 11 000 usuarios únicos en todo el mundo. Un logger que registra la presión de la red hídrica recoge únicamente 300 bytes de datos al día.

Velocidad. En la mayoría de las aplicaciones del sector hídrico se producen transferencias diarias de datos de alarmas y los tiempos de respuesta se calculan en segundos. Esta unidad de tiempo se considera lenta en muchas aplicaciones — como las operaciones de bolsa, apuestas, juegos y vehículos sin conductor—, en que los tiempos de respuesta se calculan en milésimas de segundo.

Variedad. Los datos de las compañías de aguas son bastante homogéneos. Normalmente se registran datos temporales (valores con marcas horarias e información puntual). No es necesario ingestar grandes volúmenes de fotografías, vídeos, grabaciones de audio, mensajes de correo electrónico, tuits, documentos, libros, presentaciones, etc.

Visto así, parecería que las compañías de aguas lo tienen fácil, pero lo que ocurre en realidad es todo lo contrario. El problema de estas compañías es que no pueden asignar más carga de trabajo a sus empleados, que ya están totalmente ocupados con sus tareas habituales. No les queda ni un segundo para dedicar a analizar más datos, gráficos y alarmas. Por tanto, la principal limitación es la capacidad.

La conclusión lógica es que debe ser el software el que se encargue de esas tareas. No basta con sistemas que acumulan datos pero que requieren supervisión.  El software debe extraer la información útil de los datos y priorizarla para agilizar el control. Y además debe poder utilizar simultáneamente distintas fuentes de datos.

Así pues, si la pregunta es: ¿pueden las compañías de aguas obtener y gestionar la información útil? La respuesta es sí, desde luego.

CTA_dump the data warehouse dream_ES