Para la predicción de la utilización del ancho de banda por Internet, en primer término se intentó usar las librerías implementadas en la UAB. Por lo complejo del código y la falta de documentación resultó difícil implementarlas como solución para la prueba inter cluster, por lo que se optó por realizar una búsqueda encontrándose gran cantidad de herramientas disponibles en Internet. Resultados de esta prueba pueden ser observados en la Tabla 5.
Cluster Nro.Comp (Mbytes/sec) LAN TPUT (10-3 tareas por AvPerf
sec) EstPerf
Estimate
Efficiency Experimental Speedup Precision
G3 3 10 2.2 1 100.00% 0.86 86.00%
G4 3 10 2.4 1 100.00% 0.9417 94.00%
GridCDF 4 10 79 1 100.00% 0.98 98.00%
Tabla 5. Tiempos de ejecución de funcionalidad de servicio
La herramienta seleccionada, por su sencillez de instalación y su funcionalidad, fue Netperf [31]. Esta funcionó correctamente mientras las direcciones IP fueran públicas, pero una vez que se implementó una red privada virtual entre la Universidad del Comahue y la empresa CDF, la medición del ancho de banda consumido resultó constantemente igual al máximo disponible, por más que la red estuviera congestionada. Luego de intensas pruebas se llegó a la conclusión de que al tener la VPN funcionando sobre interfaces virtuales, la medición de utilización que este software realizaba era la de la conexión al buffer del dispositivo virtual de la VPN, y no la real de las interfaces físicas de la red. En segundo lugar, y teniendo este problema en mente, se usó la herramienta Iperf [25], diseñada para medir consumos de ancho de banda con protocolos TCP y UDP. En este caso se disponía de una opción prefill-buffer, que completaba el buffer del
dispositivo antes de comenzar la transmisión de la información, y lo que se mide es el flujo de datos a partir del momento en que el buffer se completa. Como resultado de estas mediciones se obtuvo el gráfico de la Figura 10. En el mismo se pueden observar sobre el eje de las abscisas las fechas en que fueron realizadas las mediciones, hechas cada diez minutos por un lapso de 30 segs.
46 Figura 10.Mediciones de ancho de banda Comahue - CDF
La conexión a Internet en la UNC es simétrica de 256Kbps y la conexión de la empresa es asimétrica con 512Kbps de descarga y 190Kbps de subida a Internet. Como el nodo coordinador se encuentra en la Universidad del Comahue y uno de los clusters está en la empresa CDF, las mediciones de tráfico se realizaron sobre el canal saliente desde la empresa hacia la UNC, para medir el vínculo más débil.
Se realizó un estudio para observar si era conveniente determinar la cantidad de nodos de cómputo en los clusters dependiendo de si la conexión a Internet se encontraba en un valle o un pico (Figuras 11 y 12). Con las cotas impuestas en los valores que se ven en los dos siguientes gráficos se cubre un 80% de los valores totales medidos.
47
En la Figura 10 se pueden observar tres tipos de líneas. La primera, desplazándose sobre el eje y, representa los valores obtenidos en esas fechas. La siguiente sobre esta es una media obtenida cada 100 valores. Con este análisis se intenta estimar la frecuencia de picos y valles sobre los valores obtenidos. Por último, una línea horizontal corresponde a una regresión lineal para realizar un ajuste de los valores. Sobre este último análisis se obtiene un valor cercano a los 0,11 Mbps de promedio para el uso de la conexión entre los laboratorios.
Figura 12.Anchos de Banda limitando solo los valores de los valles. (0 Kbits – 0.5Kbits)
Sobre estos datos y aplicando las fórmulas de [29] se obtiene la Tabla 6. En la columna Internet Tput, línea correspondiente al cluster GridCDF, se puede observar el cambio de valor con respecto a la ejecución por Internet. En la fila de G4 el valor no cambia, ya que este cluster se encuentra en una Intranet de la facultad y el impacto de la conexión de red es mínimo.
Cluster Comp Nro. Internet TPUT (Mbits/sec)
AvPerf (10-3 tareas por
sec) EstPerf Estimate Efficiency
Experiment
al Speedup Experimental Efficiency Precision
G3 3 2.2 1 100.00% 0.86 86% 86.00%
G4 3 93.7 2.4 1 100.00% 0.7661 77% 76.00%
GridCDF 4 0.11 79 0.5949 59% 0.5990 40% 99.00%
Total 10 83.6 2.59 86% 2.23 68% 86%
Tabla 6. Mediciones Intranet-Internet
Los datos experimentales de performance obtenidos sobre los clusters GridCDF y G4 incluyen la sobrecarga del middleware Grid. Desde una máquina coordinadora se ejecuta en forma remota el cálculo sobre el cluster, y cuando éste termina se recupera la matriz resultante. La descripción en formato XML de la tarea ejecutada se observa en el Código 2.
48 <job> <executable>/usr/RedOsciladores/redPar</executable> <directory>${GLOBUS_USER_HOME}</directory> <stdout>${GLOBUS_USER_HOME}/stdoutRP2</stdout> <stderr>${GLOBUS_USER_HOME}/stderrRP2</stderr> <count>5</count> <jobType>mpi</jobType> <fileStageOut> <transfer> <sourceUrl>file:///home/mlbeg3/red.dat</sourceUrl> <destinationUrl>gsiftp://g4.uncoma.edu.ar/tmp/red2.dat</destinationUrl> </transfer> </fileStageOut> </job>
Tag executable. Archivo ejecutable compilado con librerías MPI Tag directory. Directorio de trabajo
Tag std. Archivo de salida stdout y stderr
Tag count. Cantidad de procesos a ejecutar sobre el cluster. Tag jobType. Especificación para la ejecución con librerias MPI
Tag fileStageOut. Tareas de transferencia de archivos, una vez terminada la ejecución del procesamiento. globusrun-ws -submit -s -F gridcdf.uncoma.edu.ar -f redparSCop_CDF.xml
Código 2. Comando de ejecución sobre el nodo Grid GridCDF del archivo XML.