• No results found

Extended Hyperledger Fabric

In document Blockchain-Enabled DPKI Framework (Page 73-79)

3.4 Software Architecture Components

3.4.2 Extended Hyperledger Fabric

El principal material para la realización de esta tesis lo constituyen los datos. Se han trabajado diferentes fuentes de información:

- Por un lado se tienen datos de la Confederación Hidrográfica sobre las

concentraciones de parámetros hidroquímicos disueltos en las aguas y recogidas por las estaciones de muestreo y aforo en el periodo 1981-2003. Estas estaciones de muestreo toman los datos de forma irregular y con periodicidad diferente. Hay bastante correlación entre los parámetros medidos. Existen bastantes datos faltantes que van desde un 2.5% en el calcio hasta un 89.3% en el plomo. También se han detectado datos anómalos sobre todo al realizar análisis descriptivos sobre índices, algunos de los cuales se obtienen como cocientes de parámetros (se corrigieron 15 datos y se supuso que se había cometido error en el lugar de poner el decimal, por ejemplo 3.50 se sustituye por 35.0 para ión sodio en estación 3 enero 86 ).

- Por otro lado existe otra base de datos desde octubre de 1973 hasta julio de 1986

con 18 parámetros proporcionada por el catedrático de la Universidad Politécnica de Madrid José María Gascó.

En general, en la investigación se han utilizado los datos proporcionados por la Confederación Hidrográfica, restringidos al periodo 1983-2002, y eligiendo sólo las estaciones de muestreo que tienen datos a lo largo de este periodo. El motivo de esta decisión se basa en la búsqueda de la máxima uniformidad de los resultados globales, y la posibilidad de establecer comparaciones entre estaciones. Cuando se realiza algún estudio sobre estaciones individuales y no se comparan los resultados entre ellas entonces se utiliza toda la información disponible.

Para las técnicas de Análisis Cluster, Series Temporales y Funciones de Transferencia hemos tenido que prescindir de algunos parámetros que se presentan de forma esporádica -carbonatos, cianuro, cloroformo, …- ya que su tratamiento en las

Capítulo 4

24

series sería muy dificultoso al tener medianas iguales a 0 para todas las estaciones, además de alterar las estructuras de correlación en los tratamientos estadísticos.

Como se indicó con anterioridad, otra dificultad añadidas en los datos es la falta de homogeneidad en la recogida de la información, posiblemente por problemas de competencias, ya que son 9 las regiones autónomas que tienen territorios en la Cuenca.

A modo de resumen sobre laperiodicidad en la recogida de los datos de cada estación

cabe señalar:

• Estaciones de periodicidad principalmente mensual: son las estaciones 1, 11, 27

(desde enero de 1987), 162 y 163.

• Estaciones de periodicidad principalmente trimestral: 2, 96, 114, 207, 208 y 421.

• Estaciones de periodicidad variable: 120 y 211.

• Estaciones de periodicidad semestral (realmente dos tomas por año aunque los

meses no tienen por qué ser coincidentes; son por tanto irregulares, existe mayoría de datos tomados en los meses enero-febrero en el semestre invierno-primavera y julio-septiembre en el semestre verano-otoño). En este grupo se encuentran el resto de estaciones.

Esta situación nos ha llevado a generar un fichero que contiene sólo dos observaciones por año para todas las estaciones, una por semestre, con el fin de que las estaciones con mayor frecuencia no tuvieran más influencia más que el resto. La forma de elegir los datos que participan en esa base para las estaciones con periodicidad trimestral consiste en:

o Semestre invierno-primavera: se elige la información correspondiente al primer

mes del que existen datos (generalmente enero, si este falta febrero y así sucesivamente).

o Semestre verano-otoño: como en el semestre anterior comenzando por julio,

pero intercambiando la prioridad de agosto por septiembre. Además contamos con la siguiente información adicional:

- Registros pluviométricos en 140 estaciones meteorológicas de la Cuenca (datos

diarios). El periodo de tiempo varía en función de la estación. Pocos datos faltantes desde el momento en el que se pone en marcha la estación. A raíz de esta

información se obtienen los L/m2 caídos por mes y año en cada estación.

- Patrones de población de los municipios de la Cuenca, desde 1900 hasta 1991 con

periodicidad aproximada de 10 años, después se maneja información relativa a los censos de los años: 1996, 1998, y desde 1999 con periodicidad mensual.

- Agua embalsada diaria en los 75 embalses que han permanecido abiertos en algún

momento del intervalo 1983-2003. Además se ha generado un archivo que contiene información exclusivamente de los pantanos que han permanecido abiertos durante todo el periodo y de los que se tienen datos para todos los meses del periodo.

- Superficie regada y tipo de cultivo a la que se dedica en hectáreas por municipio de

la Cuenca, según distintas fuentes de información en censos tomados de forma irregular en el periodo 1980-2000.

- Tipos de suelo mayoritarios en el área que rodea a la estación de muestreo y análisis

extraído del Mapa de suelos de España publicado por el Instituto de Edafología y Agrobiología del Centro Superior de Investigaciones Científicas (CSIC) en 1968. La clasificación realizada en ese mapa ha tenido que ser actualizada a la nomenclatura

Capítulo 4 25

de la FAO (IUSS Working Group WRB, 2006) según la transformación de la tabla 4-1 para los tipos de suelos más comunes en la Cuenca Hidrográfica.

Notación del mapa Notación FAO

Breve descripción

Terra Rosa Luvisols Acumulación de arcilla iluviada

Terra Fusca Umbrisols Humífero, húmedo y ácido

Pedregal Leptosols Delgado y poco desarrollado

Yeso Gypsisols Acumulación de sulfato cálcico secundario

salino Solonchaks Área salina

gley Gleysols Hidromorfo y reductomorfo

costra caliza Calcisols Acumulación de carbonato calcio secundario

Tabla 4-1. Relación entre la nomenclatura de suelos clásica en España y la seguida por la FAO.

Como material imprescindible para la elaboración de esta tesis destacar también el software estadístico SAS. Durante la elaboración de la Tesis se han podido desarrollar Macros personales que facilitan el trabajo sistemático de muchas de las aplicaciones estadísticas, no existiendo de forma directa y rápida ni en este ni en otro tipo de programas.

Capítulo 4

26

In document Blockchain-Enabled DPKI Framework (Page 73-79)

Related documents