Fundamentals of deep learning - DATA DRIVEN MODELING OF BOILING HEAT TRANSFER

CHAPTER 6. DATA DRIVEN MODELING OF BOILING HEAT TRANSFER

6.1 Fundamentals of deep learning

Previo a la estimación de modelos mixtos de PR/PD se debió determinar cuáles parámetros serán considerados “comunes” entre las funciones de utilidad de PR y PD. Para ello se debe hacer una comparación entre los coeficientes obtenidos en modelos estimados con los datos de PR y PD en forma separada (Louviere et al., 2000), a fin de hacer una estimación preliminar del factor de escala que relaciona las varianzas en ambos ambientes (el sustento teórico de este tema se presenta en el ANEXO A).

En la Tabla 5-10 se muestran los coeficientes de los mejores modelos PR y PD (MNL y ML) presentados en las secciones anteriores y la razón entre los parámetros estimados en PD y PR; esta división entre parámetros entrega un indicio del valor que podría tomar el factor de escala.

Tabla 5-10: Análisis de parámetros comunes PR/PD base PR_15_1

Fuente: Elaboración propia

En el caso de los modelos MNL, los coeficientes de PR y PD de las variables tiempo de viaje, costo y Costow son bastante similares entre sí, mientras que los parámetros de SDE y SDL son menores en PD que en PR, en especial SDL. Estos resultados sugieren que los parámetros “comunes” debiesen ser los tres primeros. Por otro lado, en el caso del ML, los parámetros con razones más similares son el tiempo de viaje, Costow y la demora horaria por llegar temprano (SDE).

El primer modelo mixto PR/PD estimado fue un MNL que consideró todos los parámetros (excepto SDE y SDL) como comunes en PR y PD, según los resultados de la Tabla 5-10. De estos resultados destaca que el factor de escala sería estadísticamente igual a uno, implicando que los errores de los datos de PR y PD tendrían similar varianza. Asimismo, se corrobora que los parámetros de SDE y SDL son diferentes entre PR y PD. La diferencia de los parámetros de demora horaria (SDE y SDL) entre PR y PD se puede deber a diversos factores. En primer lugar, a diferencias temporales entre las situaciones de elección de PR y PD: mientras la primera es el resultado de un proceso de adaptación de largo plazo (cuántas horas trabajar, dónde trabajar, etc.), la elección en PD puede ser una decisión con un horizonte de tiempo menor. En otras palabras, los individuos pueden haber preferido cambiar la hora de inicio para las condiciones de tráfico presentadas en el experimento PD, pero no estarían dispuestos a cambiar la hora a la que comienzan su viaje al trabajo de forma permanente, por motivos laborales (debe trabajar más en la tarde para compensar, etc.) o personales (menos tiempo disponible con la familia en la mañana, etc.).

Modelo 2 Modelo ECL_3 Modelo 3 MNL ML

Tiempo Viaje -0.032 -0.047 -0.037 0.9 1.2 Costo -0.00038 -0.00064 -0.00037 1.0 1.7 Costw -0.968 -0.826 -0.784 1.2 1.1 SDE -0.022 -0.038 -0.035 0.6 1.1 SDL -0.022 -0.038 -0.074 0.3 0.5 D_Tarde -0.302 -0.474 -0.217 1.4 2.2

Tabla 5-11: Resultados modelos base PR/PD_15_1

* test-t respecto a 1

Fuente: Elaboración propia

Este argumento es similar al propuesto por Borjesson (2008) para explicar la diferencia encontrada entre los parámetros de demora horaria (SDE y SDL) en sus modelos de PR y PD.

El segundo argumento, que está relacionado con el primero, es la posibilidad de que los parámetros de SDE y SDL en los modelos de PD estén influenciados

Coeficiente Valor Test-t

robusto Valor Test-t robusto Niveles Servicio Tiempo de viaje - PR/PD -0,0306 -4,03 -0,0299 -3,29 Tiempo de acceso - PR -0,0699 -5,33 -0,0697 -5,32 Tpo. transbordo público - PR -0,105 -4,13 -0,105 -4,14 Tpo. transbordo público-privado - PR -0,627 -3,8 -0,626 -3,78

Costo - PR/PD -0,00037 -3,22 -0,000379 -3,17

Comfort - Ir sentado - PD 0,307 2,22

Incertidumbre en tiempos de viaje - PD -0,891 -1,17 -0,69 -0,89 Restricciones de Programación

SDE - PR -0,0351 -9,95 -0,0354 -9,81

SDE - PD -0,0205 -3,88 -0,0252 -3,21

SDL - PR -0,0732 -9,54 -0,0726 -9,21

SDL - PD -0,0204 -3,39 -0,0279 -2,8

Llega tarde al trabajo - PR/PD -0,256 -2,71 -0,282 -2,3

# paradas intermedias - PR 3,44 3,25 3,44 3,24

Socioeconómicas

AUTLIC - PR 1,01 2,26 1,01 2,27

Interacciones

Costo/tasa salarial (Costw) - PR/PD -0,821 -3,57 -0,793 -3,28 Factor de escala PR/PD

σ PR / σ PD * 1,09 0,32 1,45 0,96

Componente de error de efecto panel

Sigma 1,30 3,06 ASC - PD Salir antes -0,602 -2,97 -0,749 -2,35 Salir después -0,812 -3,17 -0,912 -2,61 Cambio modo -1,31 -3,79 -1,6 -2,9 Log-verosimilitud rho-cuadrado ajustado # parámetros # observaciones Modelos Base PR/PD_15_1 1 -2423,09 1743 0,256 27 1_ECL -2205,03 0,323 27 1743

implícitamente por el contexto de la encuesta PD. El experimento de PD contemplaba que en el trabajo de los encuestados se había implementado un sistema flexible de horarios de entrada y salida del trabajo (además de un esquema de tarificación vial), por ende, los parámetros SDE y SDL capturan esta mayor flexibilidad. En tercer lugar, es posible que influya el hecho que en PR hay más alternativas de hora que en PD. Es esperable que mientras más alternativas de hora estén disponibles y más alejadas se encuentren de la alternativa escogida, más negativo será el efecto de las variables de

SDE y SDL.

Más resultados sobre los modelos MNL mixtos PR/PD se encuentran en la Tabla D-1 del ANEXO D. El modelo 2 es similar al modelo 1 de la Tabla 5-11, pero también considera los parámetros SDE y SDL como “comunes” en PR y PD. Se destaca que la log-verosimilitud del modelo 2 es menor a la del modelo 1 y que el factor de escala disminuye a 0,49. Por su parte, el modelo 3 incorpora las mismas variaciones sistemáticas en los gustos discutidas en la sub-sección 5.1.1 en las funciones de utilidad de PR. Finalmente, en el mismo ANEXO D se comprueba que el modelo 1 mixto de PR/PD es superior a los modelos estimados con cada tipo de dato en forma separada.

También se estimó un modelo mixto PR/PD del tipo ML con componentes de error, incorporándose el efecto panel sólo en las respuestas de PD (ver modelo 1_ECL en la Tabla 5-11). Para que el efecto panel también incorpore la respuesta de PR es necesario agregar otros 99 componentes de error, aumentando considerablemente el tiempo y recursos computacionales necesarios para su estimación (a modo de referencia, la estimación del modelo 1_ECL tardó 2 días y 8 horas en un computador con un procesador Core i5 de 2.5 GHz). Es por ello que esta última estimación no se realizó, recomendándose como trabajo futuro para extender esta tesis. En cuanto a los resultados del modelo 1_ECL, se aprecia que el componente de error es bastante significativo y que la bondad de ajuste del modelo mejora bastante; por ende, se corrobora la presencia de efecto panel. Asimismo, aumenta el factor de escala, implicando que los datos de PR tienen mayor varianza, aun cuando el factor sigue siendo estadísticamente igual a 1. El valor absoluto de los coeficientes SDE y SDL en PD también aumenta, aunque siguen siendo bastante menores que sus símil en PR.

Por último, en la Tabla D-3 del ANEXO D se muestran las valoraciones monetarias y razones de compromiso entre las variables SDE, SDL y tiempo de viaje para los modelos de la Tabla 5-11.

In document Development of a Data-Driven Analysis Framework for Boiling Problems with Multiphase-CFD Solver. (Page 118-124)