• No results found

Chapter 2 Literature review

2.4 Distance learning background

2.4.3 Virtual and augmented reality

La fuente de datos es una página HTML que contiene información sobre el tema que interesa obtener datos, donde dicha página es localizada mediante un URL. La búsqueda de la información se hace siempre sobre la misma página, no se realiza una búsqueda en otras páginas, aun cuando se encuentren en el mismo servidor.

No obstante, hay factores que considerar para elegir la fuente de datos:

1) Confiablidad de la fuente. La fuente debe tener validez dentro del área de dominio de interés. Esto permite veracidad en los datos obtenidos.

2) Periodicidad de los datos. El tiempo que los datos permanecen en la fuente, la frecuencia con la que cambian, o incluso considerar que dichos datos pueden desaparecer en un determinado tiempo.

3) Presentación de los datos. La forma en que los datos aparecen en la fuente, hay que considerar que esta forma puede cambiar con el tiempo.

Un factor importante para la elección de la fuente de datos es el propósito del uso de la misma, las situaciones más relevantes se proponen a continuación:

3.4.1 Seguimiento en el tiempo de una misma fuente

En esta situación, la estructura de datos en la página permanece constante, pero los datos cambian de manera periódica, incluso el URL asociado a la página puede cambiar si es una página generada de manera dinámica.

Como ejemplos tenemos el seguimiento de mediciones del clima en una región determinada o estadísticas de un torneo deportivo.

En este escenario hay que responder las siguientes preguntas:

¿La fuente es capaz de producir datos confiables a través de una conexión confiable? Definimos como un dato confiable aquel que no cambia de manera frecuente, de acuerdo al usuario de la estrategia y se encuentra validado o respaldado por alguna institución cuya veracidad se considere válida por el usuario de la estrategia. De igual forma, la conexión confiable garantiza que la fuente va a permanecer en la misma dirección URL. Es de considerar la veracidad de la fuente, porque los datos hallados, o la falta de los mismos, influirán en los ajustes que se hagan a la estructura de búsqueda.

¿Por cuanto tiempo permanecerá la fuente de datos disponible? En este punto nos referimos al tiempo que la fuente existirá. Es de esperar que un sitio de WWW de una compañía como un periódico de circulación nacional en un país, exista varios años, mientras que si la fuente es un documento que el usuario de la estrategia poseé, no se conoce a ciencia cierta si existen otras copias disponibles de dicho documento, en otras páginas, para el usuario. También influye el tiempo que se realizó el documento, suponiendo una página que predice los resultados de la Copa del Mundo de Futbol, es de esperar que estos datos no estén disponibles una vez que la Copa terminó.

¿Que tan estable es la estructura de la fuente? Nos referimos en este caso a la frecuencia con que la estructura de los datos cambia, no los datos en sí. Esta situación es la menos frecuente de las mencionadas, pero es importante considerar sobre todo para el seguimiento de una misma fuente en el tiempo. Por ejemplo, una página que hable de fútbol y que ha modificado la forma de desplegar los resultados de partidos. Los datos pueden no cambiar, pero la forma en que se despliegan sí.

3.4.2 Búsqueda de información en distintas fuentes

En esta situación, se buscan los mismos datos, pero en distintas páginas de red. Como ya se ha mencionado, distintas páginas de red pueden mostrar la misma información pero el formato en que se presentan es diferente, por lo que una misma estructura de datos de búsqueda puede ser efectiva en una página; mas no en la otra, eso sin contar la idea de que en ambas páginas el mismo concepto se refiera de manera diferente. Por ejemplo, la terminología de informática usada en España y en México difiere notablemente, una página redactada en el idioma castellano usado en España usará vocablos diferentes a los que usa una página redactada con los vocablos usados en México.

Es requisito que se haya evaluado previamente que la fuente efectivamente contiene alguno de los elementos de la estructura a buscar. En este caso el usuario de la estrategia es quien evalúa la fuente, ya que tiene conocimientos en el dominio de interés de la búsqueda de información. De otra forma, la búsqueda de datos puede arrojar resultados no deseados.

Destaca el conocimiento en el dominio de interés, ya que es el que permite definir la precisión de la estructura de búsqueda. Como se verá en el primer caso práctico, que trata sobre recopilación de datos de béisbol, un dato sumamente importante es el porcentaje de bateo pues es uno de los indicadores principales del desempeño de un bateador. De igual forma, la manera en que se representan la cantidad de entradas que un lanzador lanzó incluye el uso de fracciones de 3, que para un lector no conocedor del dominio de interés, puede resultar incomprensible el uso y significado de dichas fracciones.