• No results found

CHAPTER 6 MODELLING ENTERIC METHANE ABATEMENT FROM

6.2.1. Static analysis

Aunque todas las fases del modelo propuesto son importantes, quizás esta primera fase de selección de las fuentes de información constituye un elemento fundamental. Al fin y al cabo, los datos recuperados de estas fuentes son los que se usarán para extraer la información que interese en cada momento. Una selección errónea de las fuentes conllevará a un irremediable fracaso incluso aunque se dispongan de los mejores métodos de análisis. Si la información relevante o que interesa no está contenida en las fuentes seleccionadas, resultará imposible obtenerla a partir de las mismas. Esta última afirmación puede resultar obvia pero conviene tenerla siempre presente al iniciar cualquier proceso de extracción de información. Debe dedicarse un tiempo adecuado para definir la lista de fuentes de información que se van a utilizar.

En la actualidad, la heterogeneidad de fuentes de información que se tienen al alcance de la mano es ingente gracias al desarrollo de la Tecnología de la Información y Comunicaciones (TIC). Esta variedad abarca desde bases de datos, artículos científicos, noticias, periódicos, revistas, etc., hasta contenidos más dinámicos y cambiantes generados por cualquier usuario de Internet. El éxito de la llamada Web 2.0 ha posibilitado esa generación masiva de información a través de diferentes medios como son las redes sociales, blogs, foros o wikis. Incluso la generalización en el uso de dispositivos móviles ha propiciado la aparición de nuevas formas de generar contenidos como, por ejemplo, el microblogging. Cada una de estas fuentes, desde la más tradicional a la más actual, potencialmente contiene información que puede resultar útil en función del entorno en el que uno

Fase I: Selección de Fuentes de Información

se mueva. Sería un error descartar “a priori” una fuente de información sin valorar apropiadamente sus características intrínsecas en combinación con los objetivos planteados en cada momento.

Por ello, en esta primera fase de selección de las fuentes de información, deben considerarse, al menos, los siguientes aspectos:

a) Características del resultado, o dicho de otra forma, resultados que se desea obtener. Aunque pueda parecer una contradicción, en realidad ésta debe ser la primera tarea a realizar. Empezar pensando por el resultado final que se quiere obtener, servirá de guía durante el proceso de selección. Por ejemplo, aquellas fuentes que no contengan la información que se necesita pueden ser descartadas desde un principio. Realizar un diseño preliminar con la información en la que se está interesados facilitará dicho proceso de selección.

Figura 3.2 – Problemática de la selección de fuentes de información

Métodos b) Características de la fuentes, que vienen determinadas por la naturaleza misma de la fuentes, de cómo han sido generadas, cómo se mantienen, etc. Alguno de los factores más relevantes son:

Información contenida en la fuente. Como se mencionó anteriormente, de nada sirve seleccionar una fuente de información con multitud de datos, si dichos datos no contienen la información relevante buscada en cada caso.

Formato de la información. Parte del trabajo a realizar en las siguientes fases, depende, en gran medida, del formato de la información en origen. Seleccionar fuentes que proporcionan la información en formatos estándar simplifica el posterior tratamiento de la misma, ahorrando tiempo y esfuerzo. En general, cuanto más estructurada y estándar sea la información original, más fácil será de procesar ya que, probablemente, existan multitud de herramientas y utilidades disponibles para su manipulación.

Acceso a la información, en lo que se refiere al interfaz proporcionado por la fuente. Se pueden encontrar desde aplicaciones web basadas en formularios hasta interfaces programáticas (APIs), pasando por interfaces de acceso directo a bases de datos. El acceso a la información debe valorarse considerando dos cuestiones principales: una, la carga inicial. Dos, las actualizaciones sucesivas. Durante la carga inicial, gran cantidad de información es recuperada de la fuente en un momento determinado, mientras que las actualizaciones suelen realizarse periódicamente cada cierto tiempo, por lo que son más sensibles a futuros cambios que pudieran producirse en la fuente. Dependiendo del esquema de actualización escogido para el nuevo sistema, resultará más conveniente seleccionar unas fuentes u otras.

Descargable, muy relacionado con el acceso, esta característica determina si se podrán descargar y guardar en local todos los datos de la fuente o si dichos datos deberán ser recuperados dinámicamente. Si la

Fase I: Selección de Fuentes de Información

cantidad de datos a procesar es grande, poder disponer de una copia local de los mismos puede redundar en un ahorro considerable de tiempo a la hora de procesarlos. También el tiempo necesario para descargar los contenidos puede ser un factor relevante. En efecto, si el volumen de datos es elevado puede que la fuente imponga restricciones de acceso, tanto en el ancho de banda como en el número de peticiones simultáneas, con el fin de garantizar la disponibilidad del servicio y evitar la saturación de los servidores.

Disponibilidad desde un punto de vista técnico, se refiere a la garantía que se tiene de que la fuente estará disponible siempre que se la necesite consultar. Esta característica resulta especialmente relevante en aquellos casos que los contenidos de la fuente tengan que ser recuperados frecuentemente, por ejemplo, porque no puedan ser descargados y almacenados en local.

Fiabilidad de los contenidos. Desde el punto de vista de los resultados que se quieran obtener, deberían seleccionarse únicamente aquellas fuentes que se consideren veraces o de las que se tenga una cierta garantía que la información que se va a recuperar es fiable. Este problema es especialmente relevante si se consideran fuentes generadas en el ámbito de la Web 2.0. Aunque algunos estudios señalan que algunas fuentes, como por ejemplo la Wikipedia, es tan fiable o más que cualquier otra enciclopedia tradicional [GIL05], determinar la fiabilidad de una fuente no es tarea sencilla y podría constituir el núcleo de una o varias tesis doctorales. En el caso en curso, para determinar la fiabilidad de una fuente, puede resultar suficiente con saber si los contenidos han sido revisados por expertos en el área o compilados por alguna organización de prestigio en el área.

Relevancia de la fuente de información en el área. De cara a obtener resultados que puedan ser útiles para un mayor número de personas,

Métodos será preferible considerar primero aquellas fuentes más relevantes o que son usadas por más usuarios dentro del área en cuestión.

Actualidad de la información. Dependiendo del tipo de información que se necesite recuperar, puede que sea vital contar siempre con datos muy actualizados. Saber la periodicidad con que los datos son actualizados puede ayudar en la toma de decisión final.

Los aspectos detallados anteriormente, establecen unos criterios objetivos que pretenden servir como guía en la toma de decisión final sobre las fuentes de información que pueden resultar más apropiadas. La consideración de estos aspectos contribuye a garantizar una selección más adecuada, razonada y objetiva de las mismas, aunque deberá determinarse en cada caso qué factores tienen más relevancia que otros en función de los resultados que se quieran obtener.

Related documents