Register Structure and Registration Process for an IHO Object Register

4.4.1. Objetivo del experimento

En el tercer experimento, el objetivo se centra en conocer el rendimiento del modelo de predicci ´on al evaluarse durante un periodo prolongado de tiempo. Al analizar los modelos

de predicci ón de los trabajos relacionados se identific ó que ninguno de ellos considera este aspecto. Esto es, los trabajos relacionados no eval úan el rendimiento de sus modelos de predicci ón en variadas ocasiones (i.e. semanas, meses).

Predecir la movilidad del usuario durante un periodo prolongado resulta relevante de- bido a la dinamicidad de la movilidad del usuario; los usuarios cuentan con diferentes POIs a lo largo del tiempo, o bien cambian los tiempos de estad´ıa en dichos POIs. En t érminos de la precisi ón no es adecuado contar con un único modelo de predicci ón para estimar la movilidad del usuario a lo largo del tiempo. A fin de considerar los cambios en la movilidad del usuario, el entrenamiento del modelo de predicci ón se realiza con los datos m ás recientes; se utiliza una ventana deslizante. En este experimento la definici ón de las observaciones difiere de los dos experimentos anteriores.

A continuaci ´on se presenta la descripci ´on de este experimento.

4.4.1.1. Usuarios considerados en el experimento

Al igual que en el experimento anterior, en éste se utilizaron los datos del proyecto Geolife de Microsoft Research. Aunque el conjunto de datos contiene registros de 178 usuarios, s ólo se consideraron los registros de 18 usuarios. El objetivo de este experimento es conocer la efectividad del modelo de predicci ón durante un periodo prolongado de tiempo; por lo que se requiere contar con usuarios que cuenten con registros de localizaci ón durante varios meses. En la Tabla 5 se presenta la informaci ón relacionada a los registros de los 18 usuarios seleccionados; cantidad m´ınima, m áxima y el promedio de semanas durante las cuales se tienen registros de localizaci ón para cada d´ıa de la semana.

4.4.1.2. Puntos de inter ´es

A fin de identificar los lugares significativos del usuario a diferentes niveles de granu- laridad, se utilizaron tres valores para el radio del cl úster. A diferencia del experimento anterior, en éste, los algoritmos para identificar POIs tanto en exteriores como en inte- riores consideran radios de cl úster de 100, 250 y 500 metros. La raz ón de utilizar radios de cl úster m ás grandes en este experimento, se debe a que conforme se considera un

Tabla 5: Datos de localizaci ´on de acuerdo al d´ıa de la semana. Lu Ma Mi Ju Vi Sa Do Promedio # semanas 15 16.29 16.35 17.47 16.64 16.58 18 Max # semanas 82 94 84 87 89 87 74 Min # semanas 9 12 11 13 13 11 9

periodo de tiempo mayor, se encuentra una mayor dispersi ón de los registros GPS (origi- nada por el error de las lecturas GPS). Por lo tanto, para un mismo lugar significativo, los centroides del punto de inter és var´ıan. Por consiguiente, a fin de evitar la identificaci ón de un lugar como varios puntos de inter és, se contemplan radios de cl úster m ás grandes, de esta manera, los cl úster incluyen el lugar significativo.

4.4.1.3. Ventana deslizante

Como se mencion ó en el cap´ıtulo anterior, en este experimento se emplea de la ventana deslizante para considerar únicamente los datos de la movilidad m ás reciente del usuario durante un periodo de tiempo dado.

Con el objetivo de conocer el rendimiento de los modelos de predicci ón al utilizar los datos de movilidad asociados a diferentes periodos de tiempo, se utilizaron dos valores para la ventana deslizante: 4 y 8 semanas. De esta manera, se pretende conocer la variaci ón en el n úmero de POIs, y la precisi ón de la predicci ón.

4.4.2. Modelo de predicci ´on

Con respecto a la definici ´on del modelo de predicci ´on en este experimento, los com- ponentes del HMM se definen de la siguiente manera:

4.4.2.1. Estados ocultos

Los estados ocultos se definen por el conjunto de POIs. Adem ´as, se agreg ´o un estado adicional para definir que el usuario se encuentra en un lugar que no se considera POI (o bien que el usuario se encuentra en movimiento).

4.4.2.2. Observaciones

A diferencia de los experimentos anteriores, en los cuales las observaciones representan un tiempo espec´ıfico del d´ıa, en este experimento las observaciones representan un periodo de tiempo.

Al utilizar la ventana deslizante, se da el caso de que ésta considera los datos asociados a diferentes patrones de movilidad. Por lo tanto, existe una variaci ón y traslape en cuanto a los tiempos de arribo y/o partida a los diferentes puntos de inter és. Por consiguiente, se opt ó por considerar las observaciones como un periodo de tiempo. Para definir las observaciones se utilizaron 3 valores diferentes para el periodo: 2, 3, y 4 horas. De esta manera, al utilizar un periodo de 2 horas, la primera observaci ón (o1) contempla el

lapso de 00:00 - 1:59, la segunda observaci ón abarca el lapso 2:00 - 3:59, y as´ı sucesi- vamente. Al utilizar diferentes valores para el periodo de tiempo, se pretende identificar si existe un valor que maximice la precisi ón de la predicci ón.

4.4.2.3. Matriz de transici ´on

Esta matriz define la probabilidad de que un usuario se traslade de un POI (qi) al resto

de los POIs (incluyendo el estado correspondiente a no conexi ´on), o bien que permanezca en el mismo POIqi.

4.4.2.4. Matriz de confusi ´on

Esta matriz define la probabilidad de que un usuario se encuentre en un POI dadoqi

en el periodo de tiempo que abarca cada observaci ´onoj.

4.4.2.5. Vector

Este vector define la probabilidad de que el usuario inicie su d´ıa en un POIqi.

4.4.3. Entrenamiento del modelo de predicci ´on

En este experimento cada modelo de predicci ´on se entrena considerando los datos correspondientes al periodo de tiempo que abarca la ventana deslizante, ya sea 4 u 8

semanas. As´ı, para realizar la predicci ´on para un d´ıa lunesi, el modelo se entrena con los datos correspondientes a los lunesi−1,i−2,i−3, y finalmentei−4, esto cuando el tama ˜no de la ventana deslizante es de 4 semanas. En el caso de la ventana de 8 semanas el entrenamiento se extiende hasta el lunesi−8.

Para realizar el entrenamiento y evaluar el rendimiento de cada modelo de predicci ón se utiliza la totalidad de los datos disponibles para cada usuario y d´ıa de la semana con- siderado. La cantidad de datos que se utilizaron para cada d´ıa de la semana se presenta en la Tabla 5; a lo m áximo se cuenta con hasta dos a ños de datos de localizaci ón, lo cual permite evaluar el modelo de predicci ón en variadas ocasiones.

4.4.4. Predicciones

En cada semana de pruebas y para cada modelo de predicci ´on se realizaron 4 predicciones considerando diferentes valores para ∆T: 1, 2, 4 y 8 horas; 28 predicciones por cada usuario y semana considerada. Al igual que en los experimentos anteriores, los modelos de predicci ´on se definieron utilizando un HMM de primer orden.

4.4.5. Efectividad de la predicci ´on

Al igual que en el enfoque anterior, para determinar la efectividad de la predicci ón (Ecuaci ón 23), si se desea conocer d ónde estar á el usuario en el periodo [T, T + ∆T], la predicci ón es correcta si el usuario se encuentra en el lugar qi en el intervalo [Tpred−

, Tpred +], donde representa un margen de error. Esto es, la predicci ´on es correcta

cuando el usuario est ´a en el POI definido porqi, en el periodo de tiempo que comprende

la observaci ónoi con cierto margen de error. Tambi én es correcta si la predicci ón indica

que el usuario no estar ´a en un POI (en el caso que qi corresponde a un no POI). El

margen de errorse defini ´o a 15 minutos.

En este enfoque los resultados que se obtuvieron no se comparan con el m ´etodo

N P∗. El objetivo de este experimento no reside en maximizar la precisi ´on, sino conocer el rendimiento del modelo de predicci ´on al considerar la dinamicidad de la movilidad del usuario a lo largo del tiempo.

Tpred =T +oi 1≤i≤n ´umero de observaciones en el periodo de predicci ´on. (23)

In document JCOMM EXPERT TEAM ON SEA ICE (ETSI) Second Session STEERING GROUP FOR THE GLOBAL DIGITAL SEA ICE DATA BANK (GDSIDB) Tenth Session (Page 100-113)