Computadores Paralelos

Computadores paralelos
Estructura de computadores
CONTENIDO
1. Objetivos
2. Introducción
3. Niveles de paralelismo
4. Motivación al estudio de computadores

paralelos
5. Espacio de diseño. Clasificación

y estructura general
6. Prestaciones en computadores paralelos
7. Clasificación de los sistemas de comunicación

en computadores paralelos
8. Estructura general del sistema de comunicación

en computadores paralelos
9. La interfaz de red en computadores paralelos
10. La red de interconexión en computadores

paralelos
11. Prestaciones del sistema de comunicación en

computadores paralelos
12. Resumen
13. Bibliografía
Computadores paralelos | 3
Objetivos Motivación al estudio de

• Conocer la estructura general de los computadores computadores paralelos
paralelos.
Según lo expuesto en [3] se indica que:
• Aprender sobre las prestaciones de computadores
paralelos de alta disponibilidad y alto rendimiento. Durante la última década, las capacidades y el
• Diferenciar los distintos tipos de clasificación de rendimiento de los sistemas informáticos han
los sistemas de comunicación. crecido enormemente. Estos avances se deben a
dos tipos de evolución tanto en la tecnología como
• Distinguir las partes de la estructura de la red de
en la arquitectura. Los cambios tecnológicos han
interconexión.
mejorado la funcionalidad de los procesadores
VLSI, aumentado la velocidad del reloj y acelerado
Introducción la ejecución de las funciones del circuito.
Los cambios en la arquitectura del sistema
Antes de entrar en materia se quiere definir qué es la se basaron principalmente en una nueva
computación paralela, esto no es más que un formato organización que permitió una ejecución más
computacional en el que se ejecutan muchas instrucciones rápida de funciones antiguas y nuevas. Dos
al mismo tiempo. Funciona según el principio de que los aspectos de la arquitectura y la tecnología están
grandes problemas a menudo se dividen en problemas inextricablemente vinculados.
más pequeños y se resuelven al mismo tiempo
(en paralelo). Tomando en cuenta que hay varias formas Las mejoras tecnológicas facilitan los
de computación paralela que se explicaran más adelante. cambios arquitectónicos y requieren más
capacidad de circuito. Podría decirse que uno
Niveles de paralelismo
de los aspectos más representativos de estos
cambios es la aparición de las computadoras
paralelas y, por lo tanto, de la computación
El paralelismo se puede estudiar en diferentes niveles,
paralela. Una computadora paralela es una
algunos de ellos son, según Tosini [1] (Figura 1):
colección de elementos de procesamiento que
• Trabajo: se pueden ejecutar dos programas se comunican y trabajan juntos para resolver
diferentes en paralelo. de forma rápida un problema importante.
La programación paralela se refiere a cómo
• Tareas: en este nivel, algunas tareas son
crea su aplicación para que se ejecute en
independientes consideradas partes de un
computadoras paralelas.
programa dado, son llamadas tareas o misiones
interactivas. A continuación, se presentan los tipos de motivación
• Procesos: varios procesos forman una tarea. Estos con relación al paralelismo, facilitado por Venegas
son bloques con características bien definidas. [4]. La motivación del procesamiento paralelo es la
• Variables: el paralelismo es posible a nivel de motivación para estudiar sistemas con uno o más
variables porque algunas instrucciones se pueden niveles de paralelismo, entre ella están:
ejecutar en paralelo, el punto de conflicto son las
• Aplicaciones
variables comunes.
- Aplicaciones que requieren computadores
• Bit: todas las computadoras usan bits de
paralelos: son aplicaciones que requieren más
paralelismo vertical.
potencia que los sistemas de un solo procesador:
duración y calidad aceptables.
» Un ejemplo de esto es Google, ya que es un gran
sistema de base de datos, utiliza servidores de
aplicaciones o internet y asigna solicitudes a
múltiples procesadores aproximadamente un
grupo de 15 000 computadoras típicas.
- Aplicaciones científicas o de ingeniería
» Respuesta a tiempo o calidad aceptable
Figura 1. Proceso BIT [2].
» Pronóstico del tiempo
» Modelado de terremotos
» Bioinformática oceánica: establecer genes
humanos.
» Cálculos químicos
- Tratamiento de imágenes y gráficos • SISD: flujo único de instrucciones, flujo único de

» Rendering de películas: como en Pixar que datos. La CPU controla todas las operaciones
utilizaron RenderMan en 2003: Buscando a realizadas en la máquina recuperando
Nemo, Matrix Reloaded, Terminator 3. secuencialmente las instrucciones del programa
de la memoria (Figura 2).
• Accesibilidad a hardware y software
CPU:
- Varios niveles según coste y prestaciones
» PCs y estaciones de trabajo (menos de 8 000 €) - Unidad de control: ejecuta cada una de las
» Servidores básicos (menos de 20 000 €) instrucciones de programa.
» Servidores gama media (entre 20 000 y 400 - Unidad lógico/aritmética: realiza las operaciones
000 €) sobre los datos.
» Grandes servidores, mainframe servers, (desde - Registros internos: almacenan tanto los datos
400 000 €) parciales como las direcciones.
» Supercomputadores: computadores que • SIMD: flujo único de instrucciones, flujo múltiple
ofrecen las mayores prestaciones (mayores de datos, es una arquitectura en serie donde,
precios). en un momento dado, solo se ejecuta una
instrucción. SISD a menudo se conoce como una
» Lista top500 (http://www.top500.org) desde
computadora serial escalar. Todas las máquinas
1993.
SISD tienen un registro simple llamado contador
» Cluster: mejor relación prestaciones/coste. de programa que asegura la ejecución en serie del
• Facetas de diseño de sistemas informáticos programa. A medida que se leen las instrucciones
incluyendo algún tipo de paralelismo. de la memoria, el contador del programa se
- Arquitectura, estructura y organización tanto actualiza para señalar la siguiente instrucción
a nivel de un procesador como de múltiples que se serializará. Prácticamente no se fabrican
procesadores: computadoras SISD puras en la actualidad, ya que
» Elección de la más conveniente según el trabajo la mayoría de los microprocesadores modernos
a realizar (tipo de aplicación). incorporan cierto grado de paralelismo como
la canalización de instrucciones o la capacidad
» Obtener la mejor relación prestaciones/coste. de habilitar dos comandos al mismo tiempo
◦ Pocas comunicaciones: red de bajo coste. (supersónico) (Figura 3).
◦ Paralelismo grano fino: memoria compartida.
» Elección del software: cluster de
multiprocesadores de memoria compartida:
MPI + OpenMP.
» Extracción del paralelismo: a nivel de proceso,
de hebra, etc.
» Optimización del rendimiento del sistema.
Espacio de diseño.
Clasificación y
estructura general
Figura 2. Arquitectura de proceso SISD [1].
Tosini [1] indica que, los diferentes procesos de
clasificación se ejecutan en diferentes procesadores
paralelos o en diferentes núcleos del mismo procesador.
El modelo de Flynn clasifica todas las computadoras a
partir del estudio del paralelismo de instrucciones y el
flujo de datos que requieren las instrucciones en los
componentes más restrictivos de una máquina.
Figura 3. Arquitectura de proceso SIMD [1].

• MISD: flujo múltiple de instrucciones, flujo único de Sin embargo, a continuación, se muestra una
datos. Conceptualmente, varias instrucciones se clasificación ampliada que incluye algunos de los
ejecutan en paralelo en un solo dato. Esto significa avances en la arquitectura informática de los últimos
que varias instrucciones operan sobre los mismos años. Tomando en cuenta que tampoco se pretende ser
datos. Este tipo de máquinas se pueden entender de una característica completa de todas las arquitecturas
dos maneras. Una es considerar el tipo de máquina paralelas existentes.
que requiere diferentes unidades de procesamiento
para recibir diferentes instrucciones que operan Como se puede observar en la (Figura 6), los MIMD
con los mismos datos. Muchos arquitectos de TI se pueden dividir, a su vez, en multiprocesador,
han clasificado este tipo de arquitectura como multicomputadora y en máquina de flujo de datos.
poco práctica o irrealizable y en la actualidad no Incluso los multiprocesadores se pueden subdividir
existen ejemplos de este modelo. Otra forma de en NUMA, UMA y COMA según el modelo de memoria
explicar MISD es una clase de máquinas donde compartida. El tipo SIMD permanecerá con el procesador
los mismos datos fluyen a través de múltiples de matriz y el MISD se dividirá en procesadores de
unidades de procesamiento (Figura 4). matriz vectorial. Teniendo en cuenta otros dos tipos que
se han agregado que son híbridos y específicos de la
• MIMD: flujo múltiple de instrucciones, flujo múltiple
aplicación definida.
de datos. Esta es la mejor estrategia de diseño
para lograr el mejor rendimiento y la mejor relación
costo/rendimiento, pues estas son máquinas
con múltiples unidades de procesamiento donde
se pueden ejecutar múltiples instrucciones de
manera simultánea en diferentes datos. Los MIMD
son los más complejos, pero también son los que
son potencialmente más eficientes en ejecución
concurrente o paralela (Figura 5).
Figura 6. Clasificación de las arquitecturas paralelas [5].
Prestaciones en
Figura 4. Arquitectura clásica de MISD [1].
Ahora se presenta un gran sistema MPP paralelo que
computa las mejores características [2], velocidad
de cómputo, comunicación de baja latencia y alto
ancho de banda, en algunos casos el procesador
puede tener un diseño específico, software de control
altamente optimizado, etc. Sabiendo que el costo de
esta computadora es muy alto, la mejor alternativa para
conseguir una computadora paralela es: clúster.
Clúster es un sistema paralelo formado por máquinas

Figura 5. Arquitectura MIMD [1]. P de uso general (bajo coste), conectadas por una red
de comunicación (igual de bajo coste). Se supone que
no se utiliza el último modelo de procesador y que la
latencia de comunicación será un orden de magnitud
mayor que en el caso de la supercomputadora MPP.
Objetivo: buena relación costo/rendimiento.
En [3] se indica que los clústers se pueden conseguir en

dos tipos:
• Alta disponibilidad: redundancia para mantener

siempre la aplicación en funcionamiento
• Alto rendimiento: capacidad de responder de
manera más rápida.
Poseen un hardware habitual: con un procesador

estándar (memoria, disco, conexiones exteriores) red
propia con conexiones a una red global (fast) gigabit
ethernet, etc., Myrinet, SCI, Inifiniband, Quadrics.
Software habitual: con desarrollo MPI, OpenMP, HPF

(+debuggers, profiler) – administración del sistema:
instalación, monitorización, diagnosis.
Clasificación de los
sistemas de comunicación
en computadores Figura 7. Red WAN [6].
paralelos
Según Bravo [6], los sistemas de comunicación
conectan nodos a diferentes niveles del sistema, es
decir, conectan chip, tarjeta, chasis, armario, entre otros.
Desarrollados por los diseñadores de la arquitectura de
alto rendimiento, estos son clasificados así:
• WAN: red de área amplia y de conexión segura

(Figura 7), entre ellas están:
- RDSI, que se utiliza para comunicaciones de voz
y datos.
- Cajeros automáticos
Figura 8. Red LAN [6].
- Internet es una WAN que brinda cobertura global
utilizando el protocolo IP. Otro ejemplo obvio de
WAN es ISDN. • SAN: son redes de área de almacenamiento que
conectan cientos de miles de nodos con una
• LAN: red de área local, conecta cientos de miles
distancia de varios cientos de metros. Tomando
de nodos a lo largo de decenas de kilómetros de
en cuenta que esta tecnología es ampliamente
distancia. Entre este tipo de redes está: adoptada por las grandes empresas, ya que
- Red ethernet brinda más flexibilidad para adquirir y procesar
los datos que necesita para el desarrollo.
Teóricamente, las redes LAN deberían proporcionar Su función principal es que se puede expandir de
tasas de transmisión de alta velocidad de 10 Mb/s modo indefinido, brindando a los operadores una
a 10 Gb/s. Además, la tasa de error debe ser lo más increíble capacidad de almacenamiento de hasta
baja posible, del orden de 1 bit erróneo por cada 100 miles de terabytes (Figura 9).
millones de bits transmitidos. Teniendo en cuenta
otra característica requerida para una red LAN es que - Alto rendimiento
puede ser administrada por el usuario (propietario) de - Entre el sistema personalizado y la red de área local
la red LAN. Cada red LAN debe constar de los siguientes - Redes basadas en estándares: SCI o Infiniband
elementos (Figura 8): - Diseño/implementación propia del fabricante:
• Modo de transmisión/modulación: puede ser Myrinet de Myricom.
banda base o banda ancha. - QsNet de Quadrics.
• Protocolos de acceso a medios: CSMA/CD, FDDI, - Diseño/implementación por fabricantes de
paso de token, TCP, TDMA. computadoras.
• Soporte físico: cable UTP, fibra óptica o cable coaxial. Tomando en cuenta que la tecnología de la comunicación
• Topología: bus, anillo, estrella, malla ha hecho avances espectaculares en los últimos
diez años. Actualmente, se dispone de velocidades
de transferencia de hasta 10 Gb/s en las redes más
avanzadas y están disponibles en grandes empresas
con grandes recursos.
• Multiprocesador:
- Nodo = procesador + caché o memoria o E/S.
- Mensajes generados por acceso a memoria
(cargar/almacenar).
- El controlador de almacenamiento actúa como
una interfaz para la red interconectada.
- Un sistema transparente para programadores y
herramientas de programación.
- Envío de paquetes que contienen solo datos
(líneas de caché) y controles.
Figura 9. Red SAN [7]. - Tamaño de paquete especificado por el hardware.
- Protocolo de coherencia de caché.
Estructura general del • Multi-ordenador:
sistema de comunicación - Nodo = al menos un procesador + caché, memoria
en computadores e interfaz.
- Comunicación entre dos procesos en dos
paralelos computadoras: transferencia de datos desde el
almacenamiento de origen al almacenamiento
Bravo [6] indica que: los sistemas paralelos requieren de destino (enviar - recibir).
un fuerte soporte para la comunicación de procesos
- El sistema de comunicación se muestra al
y, de esta manera, acceder a la memoria compartida
programador como un subsistema de E/S.
(centralizada, SMP o distribuida, DSM) o para transferir
mensajes entre procesos (MPP). La red de comunicación - El programador controla el tamaño del paquete.
es teóricamente independiente del modelo, pero sin - Un sistema que puede dividir los datos en
olvidar que se utiliza una red adecuada para cada unidades más pequeñas para la transmisión
modelo. entre interfaces.
- Copiar datos memoria, es decir, HW interfaz (origen)
De igual forma, la estructura general de un sistema de
y memoria de interfaz HW (destino) (Figura 10).
comunicación se distribuye de la siguiente manera:
• Componentes del sistema de comunicación:

- Interfaz de red: hardware y software
- Conmutador (conmutador o enrutador)
- Enlaces
Tomando en cuenta que un sistema de

comunicaciones es el que administra e implementa
las transferencias de datos entre núcleos de nodos.
» Mensaje: una unidad de información

enviada entre nodos a través del sistema de
comunicación.
» Núcleo nodo: se puede configurar con
procesador + caché + MP + I/O.
Figura 10. Arquitectura general de un sistema de comunicación [7].
» Una transmisión de mensaje puede incluir
múltiples transmisiones de paquetes (unidad
de reenvío de interfaz).
» Los conmutadores y enlaces: son los que
enrutan los paquetes a su destino.
La interfaz de red en - El controlador de almacenamiento actúa como

una interfaz para la red interconectada.
computadores paralelos - Considerando que la implementación es solo
en hardware.
De acuerdo con Bravo [6], la interfaz de red es dividida
por multicomputadores y multiprocesadores, esto es: - Protocolo de coherencia de caché, vocabulario
propietario de paquetes (solicitud, respuesta,
• Multicomputadores: reenvío, etc.). Varias solicitudes (leer, escribir),
- Nodo = al menos un procesador + caché, memoria el sistema de comunicación produce varios
e interfaz. paquetes diferentes, esto es, control y datos.
- Comunicación entre dos procesos: transferencia
de datos, o sea, envío/recepción, desde el La red de interconexión
almacenamiento de origen al almacenamiento
de destino.
en computadores
- El sistema de comunicación se muestra al paralelos
programador como un subsistema de E/S. García [7] indica que:
- El programador controla el tamaño del paquete.
Los sistemas de comunicación pueden dividir En la conocida clasificación introducida por Flynn a
los datos en unidades más pequeñas y enviarlos principios de la década de 1970, las computadoras
entre interfaces. se clasifican según los tipos de control y flujos de
- Un nodo también tiene una red interna que datos que poseen. Aquí es exactamente donde
conecta sus componentes. aparecen, por primera vez, las máquinas paralelas
y se pueden dividir en tres clases. De estas tres
» Copiar los datos en la interfaz de memoria HW clases, las más comunes y de mayor concurrencia
(origen) y la interfaz de memoria HW (destino). son las que siguen el esquema MIMD. Basándose
- Un aspecto importante es la gestión del en tener múltiples procesadores, cada uno
almacenamiento de datos. procesando distintos datos. Este tipo de modelo de
» Almacenamiento de datos en búfer mediante concurrencia es el más complejo, pero ha estado
comunicación sin bloqueo. ganando atención y seguirá evolucionando el
- Es más probable que ocurra un error debido a la concepto de redes de interconexión.
distancia recorrida (más ruido, atenuación, etc.). Por este motivo, indica Bravo [6] que, la estructura
» Bit de error y funcionamiento de la red de interconexión está
- Tareas más complejas compuesta por lo siguiente:
» Necesidad de capa de software • Conmutadores: administran y enrutan los paquetes
- Protocolo de coherencia de caché, vocabulario al nodo de destino. Esto significa que cada paquete
de paquete propietario, es decir, solicitud, llega a una de las entradas, de esta manera, el
respuesta, transferencia, etc. Varias solicitudes conmutador obtiene el canal de salida para que el
como leer, escribir, el sistema de comunicación paquete llegue a su destino. En general, se permiten
produce varios paquetes (control y datos). transferencias en paralelo entre E/S, tomando en
• Multiprocesadores: cuenta que un conmutador n x n (n entradas y n
- Existen diferencia en la presencia o ausencia de salidas) puede implementar n permutaciones
coherencia de caché HW. distintas (Figura 11).
- Un sistema transparente para programadores y Tomando en cuenta que:
herramientas de programación. - Puede implementar la funcionalidad de uno a
- Envío de paquetes que contienen solo datos muchos y de muchos a uno.
(líneas de caché) y controles. Puede haber - Conflicto si dos o más entradas acceden a la
diferentes líneas en el paquete de control. misma salida (flechas), una entrada a la vez debe
Tomando en cuenta el tamaño de los paquetes acceder a la salida.
relacionado con el hardware.
- Nodo = procesador + caché o memoria o E/S.
- Los mensajes generados por el acceso a
la memoria (carga/almacenamiento) son
convertidos por la red en mensajes.
Prestaciones del sistema

de comunicación en
Rubia [8] indica: el rendimiento general de un sistema
de comunicación se utiliza para medir o comparar
el rendimiento de un sistema de comunicación. Sin
embargo, se utilizan medidas de tiempo de respuesta
y productividad, ya que estas medidas evalúan el
funcionamiento del sistema y, de esta manera, el envío
de un mensaje entre dos nodos equivale a la función
Figura 11. Estructura general de un conmutador 4x4 [8]. de extremo a extremo y evaluar el comportamiento del
sistema de comunicación en su presencia de múltiples
• Enlaces y canales: un enlace de red conecta dos comunicaciones paralelas equivale al rendimiento o
componentes de un sistema de comunicación, un prestación global.
conmutador o un conmutador de interfaz de red.
Mientras que, un canal se refiere al conjunto formado Por tal motivo, se realiza evaluación al sistema de
por un enlace, aunque también conecta tanto el comunicaciones para la realización de las prestaciones
remitente como el almacenamiento del remitente, a computadores paralelos, estas son:
así como los controladores del remitente y el vínculo
• Prestaciones extremo-a-extremo: evalúa los
del remitente al recibir una unidad transmitida.
beneficios o prestaciones que ofrece un sistema
Los enlaces en computadores paralelos: son hilos de comunicación cuando se envía un mensaje
eléctricos o cables de aluminio sobre silicio o cobre desde un nodo/proceso de origen a un nodo/
o fibra óptica. Sin olvidar que la fibra óptica permite proceso de destino. Su objetivo es evaluar la ruta
una ecualización de ancho de banda más corta y de comunicación (hardware/software) entre los
más larga que el cable de cobre (Figura 12). nodos, incluidas las bibliotecas de funciones o
las herramientas de programación utilizadas para
Los canales en la red pueden ser unidireccionales o
acceder al sistema de comunicación.
bidireccionales:
Las mediciones suelen estar indicadas por dos
• Unidireccional: consiste en conexiones que permiten parámetros: retardo o latencia y ancho de banda
una transmisión en un solo sentido. (Figura 13).
• Bidireccional: consiste en conexiones que posibilitan
Medidas:
transmisiones en varios sentidos, tales como son:
- Half-duplex: permite comunicación bidireccional, - Alcance teórico: ancho de banda disponible o
pero no al mismo tiempo y que disponen de un capacidad del canal. Fast Ethernet = 100 MB/
unido enlace. seg o 12,5 MB/seg.
- Full-duplex: posibilita comunicación simultánea - Retardo, latencia total o tiempo de
en ambas direcciones, es posible que dispongan comunicación. Tiempo de envío para mensajes
de dos enlaces independientes como mínimo. de tamaño m.
- Productividad o ancho de banda efectivo. El
número de bytes enviados entre los dos nodos
por unidad de tiempo. El tamaño del mensaje
enviado dividido por el retraso total del mensaje.
Ancho de banda efectivo. Por lo general, se
especifica en MB / seg.
- Ancho de banda asintótico. Limita su
productividad al aumentar el tamaño del
Figura 12. Enlaces y canales [7].
mensaje. Máxima productividad habilitada por
un sistema de comunicación entre dos nodos.
- Escalabilidad: capacidad para mejorar el

rendimiento general del sistema, incluir nuevos
nodos finales (aumentar el número de entradas
y salidas). No siempre es posible. Un ejemplo
sencillo de esto es el “Hipercubo”.
- Separabilidad: la posibilidad de subdividir un
sistema paralelo en subsistemas paralelos.
- Simplicidad: el diseño simple hace que sea más
Figura 13. Latencia y productividad medida en un procesador fácil de entender y reduce los costos de servicio.
conectado con Fast Ethernet y con herramienta de programación - Cargas de trabajo: permite conocer las
LAM-MPI para paso de mensaje [8].
cargas de trabajo que admite la computadora,
su esquema de comunicación normal, el
• Prestaciones globales: el tráfico ingresa a la red tamaño de los mensajes, la frecuencia y más.
desde todos los nodos de entrada, lo que resulta Esto permite seleccionar el sistema de
en una distribución uniforme (igual probabilidad de comunicación adecuado.
que todos los nodos sean el objetivo de destino), • Servicios de comunicación colectivos: un buen
una distribución normal (es más probable que se sistema de comunicación es el que refiere a
dirija a los nodos más cercanos) o una distribución un supervisor que implementa mensajería,
deficiente. Será un nodo de destino no uniforme variables compartidas o ambas. Un ejemplo: la
(más nodos), habiendo canales más en uso que difusión a cuatro destinos niveles de función de
otros canales, conocidos como reducción o biblioteca corresponde a cuatro primitivas de
permutación (Figura 14). envío. Dependiendo del tiempo, si su sistema de
- Latencia media: es la suma de las latencias de comunicación tiene una interfaz de programación
todos los mensajes dividida por la cantidad de de aplicaciones (API) que implementa
mensajes. transmisiones, se evitan las cuatro iteraciones del
- En el contexto de la productividad, con máxima proceso de salida (Figura 15).
productividad solicitada.
- La máxima productividad: se logra cuando la red
se satura y el tráfico se vuelve inaceptable.
- Aumenta la latencia: el sistema debe dejar de
enviar cuando se acerque este límite. También
conocido como ancho de banda global asintótico.
- Productividad solicitada: tráfico generado por
el nodo.
- Productividad aceptada: productividad que la red
realmente lleva a cabo. Figura 14. Prestaciones globales [8].
- Rendimiento global o aceptado: número de bits

(bytes) enviados por segundo en toda la red.
» Esto se calcula contando los bits recibidos en
todos los nodos durante el siguiente intervalo
estación.
» Usualmente es dividido por el número de nodos
de la red para la normalización.
• Prestaciones adicionales: además de los
beneficios de tiempo y productividad, existen otras Figura 15. Eficiencia en los servicios de comunicación colectivos [8].
medidas que pueden proporcionar información
sobre los beneficios del sistema de comunicación,
entre ellas están:
- Funcionalidad: tipo de transmisión implementada
por el sistema de comunicación. Mensajes entre
nodos o entre funciones de acceso a memoria,
sincronización y recopilación.
» Al pasar un mensaje: transmisión uno a uno
sincronizada o asíncrona, tipo de dispersión o
reducción colectiva, etc.
» Para variables compartidas: leer, escribir,
leer-modificar-escribir etc. Implementación
recomendada en el hardware.
Resumen Bibliografía
Durante la última década, las capacidades y el [1] M. Tosini. “Introducción a las Arquitecturas
rendimiento de los sistemas informáticos han crecido Paralelas”. Universidad Nacional del Centro de la
de forma enorme. Estos avances se deben a dos provincia de Buenos Aires. 2015. [En línea]. Disponible
tipos de evolución tanto en la tecnología como en la en: https://users.exa.unicen.edu.ar/catedras/
arquitectura. Los cambios tecnológicos han mejorado arqui2/arqui2/filminas/Introduccion%20a%20
la funcionalidad de los procesadores VLSI, aumentado las%20arquitecturas%20Paralelas.pdf
la velocidad del reloj y acelerado la ejecución de las
funciones del circuito. Los cambios en la arquitectura [2]
Monografías. “Procesadores: estructura de los
del sistema se basaron, principalmente, en una nueva sistemas paralelos”. [En línea] Disponible en: https://
organización que permitió una ejecución más rápida de www.monografias.com/trabajos108/procesadores-
funciones antiguas y nuevas. estructura-sistemas-paralelos/procesadores-
estructura-sistemas-paralelos
Dos aspectos de la arquitectura y la tecnología están
[3] Xdoc. “Motivación”. [En línea]. Disponible en: https://
inextricablemente vinculados. Las mejoras tecnológicas
xdoc.mx/preview/motivacion-6049a62d1267f
facilitan los cambios arquitectónicos y requieren más
capacidad de circuito. Podría decirse que uno de los [4] P. Venegas. “Introducción al procesamiento paralelo
aspectos más representativos de estos cambios es la arquitectura e ingeniería de computadores”.
aparición de las computadoras paralelas y, por lo tanto, Universidad de Coruña. 2016- [En línea]. Disponible en:
de la computación paralela. Una computadora paralela https://docplayer.es/3981467-Indice-introduccion-
es una colección de elementos de procesamiento que a l - p ro c e s a m i e n t o - p a r a l e l o - a rq u i t e c t u r a - e -
se comunican y trabajan juntos para resolver de forma ingenieria-de-computadores-tema1.html
rápida un problema importante. La programación
[5] Universidad de Valencia. Introducción a las
paralela se refiere a cómo crea su aplicación para que
arquitecturas paralelas. [En línea]. Disponible en:
se ejecute en computadoras paralelas.
http://informatica.uv.es/iiguia/AAC/AA/apuntes/
Tomando en cuenta que los diferentes procesos de aic_intro.pdf
clasificación se ejecutan en diferentes procesadores [6] J. Bravo. “Sistemas de comunicación en
paralelos o en diferentes núcleos del mismo procesador. computadores paralelos”. 2007. [En línea]. Disponible
Por este motivo, el modelo de Flynn clasifica todas en: http://www.uhu.es/josem.bravo/AD/Tema2.pdf
las computadoras a partir del estudio del paralelismo
de instrucciones y el flujo de datos que requieren las [7] J. García. Redes de interconexión para computadores
instrucciones en los componentes más restrictivos masivamente paralelos”. Universidad de Castilla-
de una máquina. Sin embargo, no hay que olvidar La Mancha. [En línea]. Disponible en: https://
que los sistemas de comunicación conectan nodos a w e b s . u m . e s / j m g a rc i a / m i w i k i / l i b / e xe / fe t c h .
diferentes niveles del sistema, es decir, conectan chip, php?media=escuela94.pdf
tarjeta, chasis, armario, entre otros. Desarrollado por los [8] C. Rubia. “Sistemas de comunicación en computadores
diseñadores de la arquitectura de alto rendimiento. paralelos”. Universidad de Huelva. 2017. [En línea].
Disponible en: https://b0ve.com/ARCHIVOS/
UHU/Repositorio/3%C2%BA/Sistemas%20
Computadores%20de%20Altas%20Prestaciones/
Sistemas%20de%20Comunicaci%C3%B3n%20
en%20Compuntadores%20Paralelos.pdf
[9] J. Castillo. “Qué son las redes LAN, MAN y WAN y para
qué se usan. 09-Dic-2018. [En línea]. Disponible en:
https://www.profesionalreview.com/2018/12/09/
redes-lan-man-wan/

Computadores Paralelos

Uploaded by

Copyright:

Available Formats

Computadores Paralelos

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Computadores Paralelos

Uploaded by

Copyright:

Available Formats

Computadores paralelos

4. Motivación al estudio de computadores

5. Espacio de diseño. Clasificación

6. Prestaciones en computadores paralelos

7. Clasificación de los sistemas de comunicación

8. Estructura general del sistema de comunicación

9. La interfaz de red en computadores paralelos

10. La red de interconexión en computadores

11. Prestaciones del sistema de comunicación en

Objetivos Motivación al estudio de

- Tratamiento de imágenes y gráficos • SISD: flujo único de instrucciones, flujo único de

Figura 3. Arquitectura de proceso SIMD [1].

Figura 6. Clasificación de las arquitecturas paralelas [5].

Clúster es un sistema paralelo formado por máquinas

En [3] se indica que los clústers se pueden conseguir en

• Alta disponibilidad: redundancia para mantener

Poseen un hardware habitual: con un procesador

Software habitual: con desarrollo MPI, OpenMP, HPF

• WAN: red de área amplia y de conexión segura

• Componentes del sistema de comunicación:

Tomando en cuenta que un sistema de

» Mensaje: una unidad de información

La interfaz de red en - El controlador de almacenamiento actúa como

Prestaciones del sistema

- Escalabilidad: capacidad para mejorar el

- Rendimiento global o aceptado: número de bits

You might also like