Information Management and Knowledge Representation

2.2 Information Management in Semantic Audio applications

2.2.2 Information Management and Knowledge Representation

En semejanza con los sistemas distribuidos, un sistema de ficheros paralelos está montado sobre un modelo cliente/servidor cuyo objetivo es trabajar de forma conjunta con el fin de optimizar el tiempo de acceso a los datos. La diferencia con respecto a los sistemas de ficheros distribuidos está en que, en los paralelos, los datos se distribuyen por todos los servidores de E/S; de esta forma permite acceder de manera paralela a distintos datos o a los mismo datos de un fichero. La figura 1.4 muestra la arquitectura de un sistema de ficheros paralelo. Como se ve puede ver en esta imagen, existe un gran número de servidores de entrada/salida, por lo que se produce un incremento en el ancho de banda, reduciendo así el tiempo de acceso a los datos. Como se mencionó anteriormente supone la resolución del cuello de botella que se presenta normalmente en los sistemas de ficheros distribuidos.

Clientes

Figura 1. 4 Arquitectura de Sistema de fichero

paralelo

RED

Además de las características de los sistemas de ficheros distribuidos mencionadas en el Apartado 1.2.1 (Características de los Sistemas de Ficheros Distribuidos), los sistemas de ficheros paralelos, permiten ejecutar las aplicaciones paralelas con mayores prestaciones que los sistemas de ficheros distribuidos. Esto se hace mediante la distribución de un fichero entre los diferentes servidores de E/S, es decir, que puede repartirse incluso en diferentes trozos o fragmentos de un mismo fichero entre los servidores de E/S.

También hacen uso de interfaces de E/S paralela como es el caso de MPI-I/O [MPICH2] lo que contribuye al aumento del rendimiento de estos sistemas. Algunos ejemplos de sistemas de ficheros paralelos son descritos en el siguiente apartado.

1.3.2 Ejemplos de Sistemas de Ficheros Paralelos

Existe una gran cantidad de sistemas de ficheros paralelos. Entre ellos están:

PVFS (Parallel Virtual File System) [Ross02], Al igual que otros sistemas de ficheros su diseño se centra en el uso de clusters de computadores (grupo de ordenadores trabajando de manera conjunta para un fin en común), permite el acceso de operaciones de lectura y escritura concurrentes realizadas desde múltiples clientes a un fichero. Su distribución es como software libre y no se requiere de ningún hardware especial para que funcione. Es decir, trabaja sobre cluster heterogéneos. El capitulo 3 describe de manera más detallada las características y funcionamiento sobre PVFS.

GPFS (General Parallel File System)[Barkes98]. El objetivo principal en el diseño de GPFS, así como el de la mayoría de los sistemas de ficheros paralelos, es lograr un gran ancho de banda para acceder a ficheros desde cualquier cliente. GPFS está optimizado para los accesos secuenciales. Los ficheros se dividen en bloques iguales que se distribuyen por todos los discos logrando así un balanceo de carga. GPFS, soporta sin ningún problema los accesos

paralelos a los datos y metadatos de un fichero, ya que los datos son distribuidos por en los servidores de E/S a través de un modelo round-robin [Schmuck02].

Otros ejemplos de sistemas de ficheros paralelos son: Expand (Expandable Parallel File System) [García03], que es un sistema basado en servidores NFS, cuyo fin es crear una partición distribuida para almacenar los datos que han sido previamente divididos, es decir todos los ficheros en el sistema son distribuidos a través de todos los servidores NFS. Por último también están los sistemas de ficheros ParFySys [Carretero96] y Galley [Nils96].

1.3.3 Ventajas de los Sistemas de Ficheros Paralelos

Un sistema de ficheros paralelos además de contar con las ventajas mencionadas en los sistemas de ficheros distribuidos (Apartado 1.2.3), adicionalmente brinda:

 Mejora el tiempo de ejecución de las aplicaciones, disminuyendo el tiempo de acceso a los datos.

 Permite además de accesos secuenciales, accesos paralelos a los ficheros.

 Es altamente escalable, es decir cuanto mayor sea el número de servidores de E/S mejores son las prestaciones del sistema.

1.3.4 Desventajas de los sistemas de ficheros paralelos

En este caso también se pueden mencionar algunas de las desventajas de los sistemas de ficheros distribuidos. Por ejemplo:

 La carga continúa de peticiones en paralelo puede provocar cuellos de botella en los servidores E/S.

 La falta de memoria cache de datos. La mayoría de los sistemas no lo implementan por defecto ya que el mantenimiento de coherencia de los datos en

mantener los datos consistentes en las caches.

No obstante, una forma de resolver esta desventaja es la implementación de cache en los clientes. La utilización de la memoria caché puede almacenar en disco o memoria principal una copia de los datos más utilizados del sistema de ficheros, lo que permite que la ejecución de las operaciones de E/S se realice más rápidamente. Cabe destacar que el uso de cache ofrece ventajas las cuales se mencionan a continuación:

_{Reduce la carga de trabajo al servidor.}  Disminuye el tráfico de la red.

El objetivo principal de esta memoria es analizar las distintas técnicas y métodos utilizados en la implementación de cache en entornos de sistemas de ficheros distribuidos y paralelos y proporcionar nuestra propia implementación de cache. En el Capítulo 2 se muestran algunas de las implementaciones de memoria cache en los clientes para sistemas de ficheros distribuidos y sistemas de ficheros paralelos.

La siguiente parte de este capítulo se dedica a describir de manera general los sistemas de ficheros distribuidos y paralelos, así como sus ventajas y desventajas al momento de ser implementados.

In document Semantic Audio Analysis Utilities and Applications. (Page 67-70)