CLUSTERS :: aLeXAnDrE
 



aLeXAnDrE
| aLeXAnDrE : Hardware y Software Utilizado | aLeXAnDrE : Arquitectura |

| aLeXAnDrE : Funcionalidad de la Aplicación | aLeXAnDrE : Resultados Obtenidos |

Gracias al financiamiento de La Escuela Politécnica Nacional (EPN) y del FUNDACYT, en el Departamento de Electrónica, Telecomunicaciones y Redes de Información de la EPN se construyó un cluster básico y se desarrolló un programa que permite evualuar Cadenas de Markov.

El cluster implementado se deriva del proyecto Beowulf, utiliza una distribución de Linux como sistema operativo. La instalación del cluster fue realizada de forma automática utiliando las herramientas OSCAR y NPACI Rocks.

Se instalaron dos sistemas operativos para el cluster, uno utilizando Fedora Core 3.0 y el otro con CentOS 4.0.


aLeXAnDrE : Hardware y Software Utilizado

Hardware Utilizado

Componente Descripción
Placa madre Intel D865PERL
Procesador Pentium IV de 3.0 GHz con tecnología HyperThreading
Memoria 512 MB DDR
Tarjeta de red CNET 10/100/1000 Mbps ProG-2000S
Tarjeta de video ATI Radeon 9250
Disco duro 2 discos SATA de 120 GB

Características de los computadores utilizados en el cluster

Componente
Descripción
Switch
CNET de 8 puertos 10/100/1000 Mbps

Características del hardware de red

Componente
Descripción
Switch KVM
DLINK DKVM-4K de 4 puertos

Características de otros componentes

 

Software Utilizado

El software utilizado se distribuye de forma libre.

Se instaló el cluster haciendo uso de Fedora Core 3.0 utilizando la herramienta de instalación automática de clusters OSCAR; y CentOS 4.0 incluido con la herramienta de instalación automática de clusters NPACI Rocks.

[SUBIR]


aLeXAnDrE : Arquitectura

Se instalaron dos clusters: uno basado en OSCAR y otro basado en NPACI Rocks. Los dos clusters están conformados por un nodo maestro y dos nodos esclavos.

Cluster basado en OSCAR

Cluster basado en NPACI Rocks
Nodo Maestro
dArThSerVer.aLeXAnDrE
dArThSerVer.local
Nodo Cliente 1
NodoOscar1.aLeXAnDrE
compute0-0.local
Nodo Cliente 2
NodoOscar2.aLeXAnDrE
compute0-1.local

Arquitectura del Cluster con NPACI Rocks

Estructura física del cluster aLeXAnDrE construido con NPACI Rocks

Arquitectura del Cluster con OSCAR

Estructura física del cluster aLeXAnDrE construido con OSCAR

 

[SUBIR]


aLeXAnDrE : Funcionalidad de la Aplicación

En síntesis, la aplicación realiza lo siguiente:

  1. El proceso maestro lee la matriz de un archivo de configuración.
  2. El proceso maestro inicializa las librerías de MPI.
  3. El proceso maestro comprueba que la matriz cumpla con las condiciones requeridas para poder resolver la Cadena.
  4. El proceso maestro envía el paso al que se evaluará la CMTD o el tiempo de la CMTC y la dimensión de la matriz P o Q(t) a los proceso involcurados.
  5. Se obtiene la distribución al paso n o al tiempo t. Para esto, el proceso maestro calcula la proción de trabajo que le corresponde a cada proceso y envía la porción correspondiente de la matriz P o Q(t) para que los procesos ayuden en la realización de las operaciones requeridas. Una vez que los procesos realizen las tareas requeridas, los procesos envían sus resultados al proceso maestro para que este los presente en pantalla y los almacene en una archivo.
  6. Se obtiene la distribución de régimen usando un mecanismo similar al realizado en el paso anterior.
  7. Finalmente, cada proceso libera la memoria utilizada y el proceso maestro se encarga de liberar las librerías de MPI.

[SUBIR]


aLeXAnDrE : Comparación de los Resultados Obtenidos sobre el Cluster y sobre un sólo Computador

A continuación se presentan los resultados obtenidos al ejecutar la aplicación desarrollada usando OSCAR y Rocks. La aplicación fue ejecutada utilizando un sólo computador (1 procesador), y sobre el cluster usando 2 computadores (2 procesadores) y 3 computadores (3 procesadores).

Para probar la funcionalidad de la aplicación, se realizaron pruebas con matrices de orden 3, 30, 60, 90, 120, 150, 210, 270, 330, 390, 450, 510 y 600. Se realizaron pruebas resolviendo Cadenas de Markov a Tiempo Discreto y a Tiempo Continuo.

 

RESULTADOS OBTENIDOS CON OSCAR
Para evaluar las Cadenas de Markov a Tiempo Discreto, se obtuvo la distribución en el paso 25 y la distribución de régimen. Se tomó el tiempo de ejecución de la aplicación, el tiempo que tardó en obtener la distribución en el paso 25 y el tiempo que tomó en calcular la distribución de régimen.

Para visualizar de mejor manera las gráficas del tiempo requerido para obtener la distribución de régimen, la distribución al tiempo o al paso y el tiempo de ejecución en función del orden de la matriz (P o Q(t)), se presentan dos figuras por cada tabla. La primera figura presenta los valores obtenidos al utilizar matrices de orden bajo (3 a 150); y la segunda figura muestra los resultados obtenidos para las matrices de mayor orden (210 a 600).

En la Tabla 1 se presentan los resultados obtenidos al calcular la distribución en el paso 25 y en la Figura 1 se realiza una comparación de dichos resultados con 1, 2 y 3 procesadores.

 

Procesos

1

2

3

Orden de la matriz P

3

2,80E-3

2,94E-4

3,67E-4

30

8,61E-3

4,89E-3

3,52E-3

60

6,12E-2

3,17E-2

2,23E-2

90

1,88E-1

1,04E-1

1,07E-1

120

4,38E-1

2,25E-1

1,53E-1

150

8,29E-1

4,42E-1

3,00E-1

210

3,09E+0

1,63E+0

1,07E+0

270

6,90E+0

3,47E+0

2,34E+0

330

1,33E+1

6,76E+0

4,55E+0

390

2,87E+1

1,49E+1

9,99E+0

450

4,63E+1

2,33E+1

1,56E+1

510

6,79E+1

3,42E+1

2,30E+1

600

9,89E+1

4,96E+1

3,34E+1

Tabla 1

Comparación del tiempo requerido con 1, 2 y 3 procesadores para obtener la distribución en el paso 25 usando OSCAR

Figura 1 - I

Comparación del tiempo requerido con 1, 2 y 3 procesadores para obtener la distribución en el paso 25 usando OSCAR

Figura 1 ( II )

De los resultados obtenidos, al calcular la distribución en el paso 25, se puede concluir que el tiempo requerido se reduce en aproximadamente un 50% al utilizar dos procesadores y en un valor cercano al 60% al utilizar tres procesadores, si se realiza la comparación con el tiempo requerido al utilizar un sólo procesador.

De la Figura 1 (parte II), se puede concluir que el rendimiento mejora en un 50% si se utilizan dos procesadores en lugar de uno, y en un 60% si se utilizan los tres procesadores en lugar de tan sólo uno. En la Figura 1 (parte I), se puede apreciar un resultado diferente al obtenido en la Figura 1 (parte II), debido a que para las matrices de orden bajo (3 a 150), la cantidad de procesamiento es baja comparada con las operaciones requeridas para enviar y recibir los datos desde cada proceso.

En la Tabla 2 se presentan los resultados obtenidos al calcular la distribución de régimen y en la Figura 2 se realiza una comparación de dichos resultados con 1, 2 y 3 procesadores.

 

Procesos

1

2

3

Orden de la matriz P

3

1,30E-5

4,04-e2

2,16E-3

30

3,72E-4

4,26E-2

8,25E-2

60

2,53E-3

5,25E-3

7,29E-3

90

8,10E-3

1,04E-2

1,20E-2

120

1,86E-2

1,83E-2

2,01E-2

150

3,59E-2

3,04E-2

3,09E-2

210

9,70E-2

7,07E-2

9,89E-2

270

2,07E-1

1,31E-1

1,11E-1

330

3,92E-1

2,29E-1

1,82E-1

390

6,72E-1

3,70E-1

2,86E-1

450

1,06E+0

5,53E-1

4,24E-1

510

1,50E+0

8,54E-1

5,90E-1

600

2,45E+0

1,38E+0

9,79E-1

Tabla 2

Comparación del tiempo requerido con 1, 2 y 3 procesadores para obtener la distribución de régimen (CMTD) usando OSCAR

Figura 2 ( I )

Comparación del tiempo requerido con 1, 2 y 3 procesadores para obtener la distribución de régimen (CMTD) usando OSCAR

Figura 2 ( II )

De la Figura 2 (II), se puede concluir que el rendimiento mejora en un 50% si se utilizan dos procesadores en lugar de uno, y en un 60% si se utilizan los tres procesadores en lugar de tan sólo uno. En la Figura 2 (parte I), se puede apreciar un resultado diferente al obtenido en la Figura 2 (parte II), debido a que para las matrices de orden bajo (3 a 150), la cantidad de procesamiento es baja comparada con las operaciones requeridas para enviar y recibir los datos desde cada proceso.

En la Tabla 3 se presentan los tiempos de ejecución que tomó la resolución de la CMTD y en la Figura 3 se realiza una comparación de dichos resultados.

 

Procesos

1

2

3

Orden de la matriz P

3

0,00E+0

0,00E+0

0,00E+0

30

1,00E-2

0,00E+0

0,00E+0

60

6,00E-2

3,00E-2

3,00E-2

90

2,00E-1

1,10E-1

8,00E-2

120

4,70E-1

2,90E-1

1,80E-1

150

8,80E-1

7,90E-1

5,56E-1

210

3,21E+0

1,70E+0

1,14E+0

270

7,17E+0

3,63E+0

2,48E+0

330

1,37E+1

7,01E+0

4,77E+0

390

2,95E+1

1,54E+1

1,03E+1

450

4,75E+1

2,39E+1

1,60E+1

510

6,96E+1

3,53E+1

2,36E+1

600

1,02E+2

5,11E+1

3,44E+1

Tabla 3

Comparación del tiempo requerido con 1, 2 y 3 procesadores para ejecutar la aplicación para resolver CMTD usando OSCAR

Figura 3 ( I )

Comparación del tiempo requerido con 1, 2 y 3 procesadores para ejecutar la aplicación para resolver CMTD usando OSCAR

Figura 3 ( II )

De las partes I y II de la Figura 3, se puede mencionar que el tiempo de ejecución de la aplicación que permite evaluar CMTDs, se reduce aproximadamente en un 50% si se utilizan dos procesadores y en un valor cercano al 60% al utilizar tres procesadores si se compara con el tiempo de ejecución de la aplicación en un solo procesador.

Para evaluar las Cadenas de Markov a Tiempo Continuo, se obtuvo la distribución en el tiempo 0,25 y la distribución de régimen. Se tomó el tiempo de ejecución de la aplicación, el tiempo que tardó en obtener la distribución en el tiempo 0,25 y el tiempo que tomó el calcular la distribución de régimen.

Al igual que en la resolución de CMTD, descrita en los párrafos anteriores, también se presentan dos figuras por cada tabla, para presentar de mejor manera los resultados obtenidos.

En la Tabla 4 se presentan los resultados obtenidos al calcular la distribución en el tiempo 0,25 y en la Figura 4 se realiza una comparación de dichos resultados con 1, 2 y 3 procesadores.

 

Procesos

1

2

3

Orden de la matriz Q(t)

3

2,27E-4

3,94E-4

4,53E-4

30

9,87E-2

5,06E-2

3,40E-2

60

7,00E-1

3,55E-1

2,38E-1

90

2,20E+0

1,10E+0

7,38E-1

120

4,99E+0

2,55E+0

1,69E+0

150

9,63E+0

4,84E+0

3,24E+0

210

3,64E+1

1,81E+1

1,24E+1

270

8,05E+1

4,18E+1

2,66E+1

330

1,88E+2

9,40E+1

5,93E+1

390

3,15E+2

1,72E+2

1,15E+2

450

5,16E+2

2,67E+2

1,78E+2

510

7,84E+2

3,84E+2

2,61E+2

600

1,14E+3

5,68E+2

3,85E+2

Tabla 4

Comparación del tiempo requerido con 1, 2 y 3 procesadores para obtener la distribución en el tiempo 0,25 usando OSCAR

Figura 4 ( I )

Comparación del tiempo requerido con 1, 2 y 3 procesadores para obtener la distribución en el tiempo 0,25 usando OSCAR

Figura 4 ( II )

El tiempo necesario para obtener la distribución en el tiempo 0,25, utilizando un sólo procesador aproximadamente es dos veces el tiempo requerido si se emplean dos procesadores y casi tres veces si se emplean tres procesadores.

En la Tabla 5 se presentan los resultados obtenidos al calcular la distribución de régimen y en la Figura 5 se realiza una comparación de dichos resultados con 1, 2 y 3 procesadores.

 

Procesos

1

2

3

Orden de la matriz Q(t)

3

1,20E-5

3,90E-2

2,38E-3

30

3,50E-4

4,20E-2

4,20E-2

60

2,46E-3

5,20E-3

7,49E-3

90

7,98E-3

1,03E-2

1,39E-2

120

1,85E-2

1,80E-2

1,98E-2

150

3,57E-2

2,95E-2

3,08E-2

210

9,65E-2

6,90E-2

6,36E-2

270

2,12E-1

1,34E-1

1,12E-1

330

3,86E-1

2,28E-1

1,81E-1

390

6,81E-1

3,70E-1

2,87E-1

450

1,05E+0

5,76E-1

4,20E-1

510

1,50E+0

8,43E-1

5,88E-1

600

2,45E+0

1,38E+0

9,71E-1

Tabla 5

Comparación del tiempo requerido con 1, 2 y 3 procesadores para obtener la distribución de régimen (CMTC) usando OSCAR

Figura 5 ( I )

Comparación del tiempo requerido con 1, 2 y 3 procesadores para obtener la distribución de régimen  (CMTC) usando OSCAR

Figura 5 ( I )

De igual manera que en CMTD, las partes I y II de la Figura 5 presentan resultados diferentes. La parte I muestra que no existen mejoras en el rendimiento si se utilizan matrices de tamaño bajo (3 a 150), debido al procesamiento requerido para su solución y al tiempo empleado en comunicaciones entre procesos; mientras que la parte II muestra mejoras en el rendimiento al utilizar matrices de tamaño superior (210 a 600).

En la Tabla 6 se presentan los tiempos que tomó la resolución de la CMTC y en la Figura 6 se realiza una comparación de dichos resultados.

 

Procesos

1

2

3

Orden de la matriz Q(t)

3

0,00E+0

0,00E+0

0,00E+0

30

1,10E-1

6,00E-2

4,00E-2

60

7,40E-1

4,00E-1

2,80E-1

90

2,31E+0

1,20E+0

8,40E-1

120

5,18E+0

2,73E+0

1,88E+0

150

9,94E+0

5,10E+0

3,50E+0

210

3,70E+1

1,85E+1

1,27E+1

270

8,16E+1

4,28E+1

2,76E+1

330

1,89E+2

9,55E+1

6,07E+1

390

3,17E+2

1,57E+2

1,11E+2

450

5,20E+2

2,59E+2

1,75E+2

510

7,88E+2

3,97E+2

2,75E+2

600

1,15E+3

5,74E+2

3,84E+2

Tabla 6

Comparación del tiempo requerido con 1, 2 y 3 procesadores para ejecutar la aplicación para resolver CMTC usando OSCAR

Figura 6 ( I )

Comparación del tiempo requerido con 1, 2 y 3 procesadores para ejecutar la aplicación para resolver CMTC usando OSCAR

Figura 6 ( II )

De forma similar que en CMTD, el rendimiento mejora en un valor cercano al 50% con dos procesadores y casi un 60% al utilizar tres procesadores en lugar de uno.

 

RESULTADOS OBTENIDOS CON Rocks
Para evaluar las Cadenas de Markov a Tiempo Discreto, utilizando Rocks, se obtuvo la distribución en el paso 25 y la distribución de régimen.

Para visualizar de mejor manera las gráficas del tiempo requerido para obtener la distribución de régimen, la distribución al tiempo o al paso y el tiempo de ejecución en función del orden de la matriz (P o Q(t)), se presentan dos figuras por cada tabla. La primera figura presenta los valores obtenidos al utilizar matrices de orden bajo (3 a 150); y la segunda figura muestra los resultados obtenidos para las matrices de mayor orden (210 a 600).

En la Tabla 7 se presentan los resultados obtenidos al calcular la distribución en el paso 25 y en la Figura 7 se realiza una comparación de dichos resultados con 1, 2 y 3 procesadores.

 

Procesos

1

2

3

Orden de la matriz P

3

2,00E-3

1,87E-4

2,15E-4

30

8,50E-3

7,72E-3

3,39E-3

60

6,13E-2

3,15E-2

2,20E-2

90

1,88E-1

9,72E-2

6,97E-2

120

4,37E-1

2,22E-1

1,52E-1

150

8,29E-1

4,20E-1

2,87E-1

210

2,87E-1

1,60E+0

1,06E+0

270

6,94E+0

2,35E+0

2,36E+0

330

1,32E+1

6,74E+0

4,52E+0

390

2,97E+1

1,49E+1

1,00E+1

450

4,62E+1

2,32E+1

1,55E+1

510

6,81E+1

3,42E+1

2,28E+1

600

9,85E+1

4,94E+1

3,31E+1

Tabla 7

Comparación del tiempo requerido con 1, 2 y 3 procesadores para obtener la distribución en el paso 25 usando Rocks

Figura 7 ( I )

Comparación del tiempo requerido con 1, 2 y 3 procesadores para obtener la distribución en el paso 25 usando Rocks

Figura 7 ( II )

Los resultados obtenidos son muy similares a los obtenidos utilizando OSCAR. El tiempo requerido para obtener la distribución en el paso 25 en un procesador, se reduce en 1/2 al usar dos procesadores y en 1/3 si se usan los tres.

En la Tabla 8 se presentan los resultados obtenidos al calcular la distribución de régimen y en la Figura 8 se realiza una comparación de dichos resultados con 1, 2 y 3 procesadores.

 

Procesos

1

2

3

Orden de la matriz P

3

7,00E-6

3,95E-2

7,28E-4

30

3,66E-4

4,10E-2

4,15E-2

60

2,54E-3

3,52E-3

4,59E-3

90

8,10E-3

7,74E-3

8,82E-3

120

1,86E-2

1,48E-2

1,43E-2

150

3,58E-2

2,55E-2

2,29E-2

210

9,69E-2

6,22E-2

8,60E-2

270

2,03E-1

1,22E-1

9,76E-2

330

3,84E-1

2,14E-1

1,60E-1

390

6,69E-1

3,52E-1

2,64E-1

450

1,04E+0

5,43E-1

3,85E-1

510

1,50E+0

8,17E-1

5,54E-1

600

2,44E+0

1,35E+0

9,18E-1

Tabla 8

Comparación del tiempo requerido con 1, 2 y 3 procesadores para obtener la distribución de régimen (CMTD) usando Rocks

Figura 8 ( I )

Comparación del tiempo requerido con 1, 2 y 3 procesadores para obtener la distribución de régimen (CMTD) usando Rocks

Figura 8 ( II )

De igual manera que en OSCAR, de la Figura 8 (parte II) se puede concluir que el rendimiento mejora en aproximadamente 50% si se utilizan dos procesadores y en casi 60% si se utilizan los tres procesadores en lugar de uno.

En la Figura 8 (parte I) se obtuvo un resultado distinto al obtenido en la Figura 8 (parte II), y esto se debe a que en las matrices de menor orden (3 a 150), la cantidad de procesamiento es baja comparada con las operaciones requeridas para enviar y recibir los datos desde cada proceso.

En la Tabla 9 se presentan los tiempos de ejecución que tomó la resolución de la CMTD y en la Figura 9 se realiza una comparación de dichos resultados.

 

Procesos

1

2

3

Orden de la matriz P

3

0,00E+0

0,00E+0

0,00E+0

30

1,00E-2

0,00E+0

0,00E+0

60

6,00E-2

3,00E-2

2,00E-2

90

2,00E-1

1,00E-1

8,00E-2

120

4,60E-1

2,40E-1

1,70E-1

150

8,80E-1

4,60E-1

3,20E-1

210

3,30E+0

1,69E+0

1,13E+0

270

7,19E+0

3,66E+0

2,48E+0

330

1,36E+1

6,96E+0

4,69E+0

390

3,05E+1

1,53E+1

1,03E+1

450

4,73E+1

2,38E+1

1,59E+1

510

6,98E+1

3,52E+1

2,35E+1

600

1,01E+2

5,09E+1

3,41E+1

Tabla 9

Comparación del tiempo requerido con 1, 2 y 3 procesadores para ejecutar la aplicación para resolver CMTD usando Rocks

Figura 9 ( I )

Comparación del tiempo requerido con 1, 2 y 3 procesadores para ejecutar la aplicación para resolver CMTD usando Rocks

Figura 9 ( II )

De la Figura 9 se puede mencionar que el tiempo de ejecución de la aplicación que permite evaluar CMTDs, se reduce aproximadamente al 50% si se utilizan dos procesadores y en un valor cercano al 60% al utilizar tres procesadores si se compara con el tiempo de ejecución de la aplicación en un solo procesador.

Para Cadenas de Markov a Tiempo Continuo, utilizando Rocks, se obtuvo la distribución en el tiempo 0,25 y la distribución de régimen.

Al igual que en la resolución de CMTD, descrita en los párrafos anteriores, también se presentan dos figuras por cada tabla, para presentar de mejor manera los resultados obtenidos.

En la Tabla 10 se presentan los resultados obtenidos al calcular la distribución en el paso 25 y en la Figura 10 se realiza una comparación de dichos resultados con 1, 2 y 3 procesadores.

 

Procesos

1

2

3

Orden de la matriz Q(t)

3

2,34E-4

2,74E-4

3,12E-4

30

9,89E-2

5,01E-2

3,40E-2

60

6,98E-1

3,58E-1

2,96E-1

90

2,18E+0

1,10E+0

7,34E-1

120

4,97E+0

2,52E+0

1,67E+0

150

9,59E+0

4,83E+0

3,22E+0

210

3,67E+1

1,83E+1

1,26E+1

270

7,96E+1

3,95E+1

2,64E+1

330

1,54E+2

7,69E+1

5,52E+1

390

3,47E+2

1,77E+2

1,18E+2

450

5,13E+2

2,65E+2

1,76E+2

510

7,82E+2

3,93E+2

2,61E+2

600

1,14E+3

5,28E+2

3,79E+2

Tabla 10

Comparación del tiempo requerido con 1, 2 y 3 procesadores para obtener la distribución en el tiempo 0,25 usando Rocks

Figura 10 ( I )

Comparación del tiempo requerido con 1, 2 y 3 procesadores para obtener la distribución en el tiempo 0,25 usando Rocks

Figura 10 ( II )

El tiempo necesario para obtener la distribución en el tiempo 0,25, utilizando un sólo procesador aproximadamente es dos veces el tiempo requerido si se emplean dos procesadores y casi tres veces si se emplean tres procesadores.

En la Tabla 11 se presentan los resultados obtenidos al calcular la distribución de régimen y en la Figura 11 se realiza una comparación de dichos resultados con 1, 2 y 3 procesadores.

 

Procesos

1

2

3

Orden de la matriz Q(t)

3

7,00E-6

3,98E-2

7,07E-4

30

3,50E-4

4,11E-2

4,20E-2

60

2,46E-3

3,52E-3

4,92E-3

90

7,94E-3

7,74E-3

8,66E-3

120

1,84E-2

1,47E-2

1,41E-2

150

3,55E-2

2,51E-2

2,28E-2

210

9,59E-2

6,19E-2

5,27E-2

270

2,08E-1

1,22E-1

9,70E-2

330

3,89E-1

2,14E-1

1,62E-1

390

6,81E-1

3,57E-1

2,75E-1

450

1,04E+0

5,52E-1

3,94E-1

510

1,53E+0

8,22E-1

5,54E-1

600

2,44E+0

1,37E+0

9,16E-1

Tabla 11

Comparación del tiempo requerido con 1, 2 y 3 procesadores para obtener la distribución de régimen (CMTC) usando Rocks

Figura 11 ( I )

Comparación del tiempo requerido con 1, 2 y 3 procesadores para obtener la distribución de régimen (CMTC) usando Rocks

Figura 11 ( II )

De igual manera que en CMTD, las partes I y II de la Figura 11 presentan resultados diferentes. La parte I muestra que no existen mejoras en el rendimiento si se utilizan matrices de tamaño bajo (3 a 150), debido al procesamiento requerido para su solución y al tiempo empleado en comunicaciones entre procesos; mientras que la parte II muestra mejoras en el rendimiento al utilizar matrices de tamaño superior (210 a 600).

En la Tabla 12 se presentan los tiempos de ejecución que tomó la resolución de la CMTC y en la Figura 12 se realiza una comparación de dichos resultados.

 

Procesos

1

2

3

Orden de la matriz Q(t)

3

0,00E+0

0,00E+0

0,00E+0

30

1,10E-1

6,00E-2

4,00E-2

60

7,40E-1

3,90E-1

2,80E-1

90

2,29E+0

1,19E+0

8,20E-1

120

5,15E+0

2,65E+0

1,84E+0

150

9,88E+0

5,07E+0

3,46E+0

210

3,73E+1

1,89E+1

1,28E+1

270

8,06E+1

4,67E+1

2,73E+1

330

1,56E+2

7,83E+1

5,65E+1

390

3,49E+2

1,75E+2

1,18E+2

450

5,16E+2

2,62E+2

1,76E+2

510

7,85E+2

3,97E+2

2,65E+2

600

1,14E+3

5,87E+2

3,82E+2

Tabla 12

Comparación del tiempo requerido con 1, 2 y 3 procesadores para ejecutar la aplicación para resolver CMTC usando Rocks

Figura 12 ( I )

Comparación del tiempo requerido con 1, 2 y 3 procesadores para ejecutar la aplicación para resolver CMTC usando Rocks

Figura 12 ( II )

De forma similar que en CMTD, el rendimiento mejora en un valor cercano al 50% con dos procesadores y casi un 60% al utilizar tres procesadores en lugar de uno.

 

ANÁLISIS DE RESULTADOS
Se puede ver que en promedio, usando 2 procesadores, el tiempo que toma obtener la distribución en el paso 25 de Cadenas de Markov a Tiempo Discreto, tanto en OSCAR como en Rocks, es un valor cercano a la mitad del tiempo que
toma el hacerlo con un sólo procesador; y usando 3 procesadores, el tiempo que toma se reduce a un valor cercano al tercio del valor que toma sobre uno sólo.

En promedio algo similar a lo descrito en la obtención de la distribución en el paso 25, ocurre para la distribución en el tiempo 0,25 de Cadenas de Markov a Tiempo Continuo.

Se puede apreciar también, que en el caso de la distribución de régimen, tanto en CMTD como en CMTC, para OSCAR y Rocks, se tienen valores que no muestran una mejora al compararlos con respecto a los valores obtenidos en un procesador, para matrices de tamaño pequeño (de orden 3 a 150), debido a que la cantidad de operaciones es baja comparada con el tiempo requerido para el envío de datos entre procesos. Pero se puede apreciar una mejora en las matrices de mayor tamaño (orden superior a los 150), usando 2 procesadores el tiempo que se tarda en obtener la solución del sistema de ecuaciones se reduce en un 50% aproximadamente, y utilizando 3 procesadores el tiempo se reduce en promedio en un 60%.

Finalmente, se puede mencionar que el tiempo de ejecución total se comporta de forma similar a la descrita para la distribución en el paso 25 o en el tiempo 0,25. Esto se debe principalmente a que el tiempo que toma el obtener la distribución de régimen es bajo comparado con el tiempo que toma el obtener la distribución en el paso o en el tiempo y a la cantidad de operaciones involucradas en el cálculo de ambas. Se puede apreciar también, que el tiempo en leer la matriz P o Q, y almacenar los resultados, es decir las operaciones no paralelizadas, consumen poco tiempo comparado con las operaciones realizadas en paralelo.

[SUBIR]