Verteilte und Parallele Programmierung

Mit Virtuellen Maschinen

PD Stefan Bosse

Universität Bremen - FB Mathematik und Informatik

1 / 84

PD Stefan Bosse - VPP - Metriken und Verhalten von Parallelen Programmen ::

Metriken und Verhalten von Parallelen Programmen

Wie können parallele und nebenläufige Prozesse quantitativ erfasst werden?

Was kann schief gehen?

Was begrenzt die Parallelisierung?

2 / 84

PD Stefan Bosse - VPP - Metriken und Verhalten von Parallelen Programmen :: Zustands-Raum Diagramme

Zustands-Raum Diagramme

Für die Visualisierung und Analyse von nebenläufigen Prozessen und Aktionen

Zustands-Raum Diagramme beschreiben die möglichen Zustands-Entwicklungen - das temporale Verhalten - von parallelen Programmen.

3 / 84

PD Stefan Bosse - VPP - Metriken und Verhalten von Parallelen Programmen :: Zustands-Raum Diagramme

Computer sind endliche Zustandsautomaten. Der Zustandsübergang wird durch die Programminstruktionen hervorgerufen.
Der Zustand S eines parallelen Programms welches aus N Prozessen P_i besteht setzt sich zusammen aus folgenden Tupeln:
- Globale Variablen des Programms:
- Lokale Variablen und Instruktionszeiger von Prozess 1:
- Lokale Variablen und Instruktionszeiger von Prozess 2: usw.
Die Berechnung ändert globale und lokale Variablen (Datenfluss) sowie Instruktionszeiger (Kontrollfluss) und führt zu einer Zustandsänderung comp: s_i → s_j.

4 / 84

PD Stefan Bosse - VPP - Metriken und Verhalten von Parallelen Programmen :: Nebenläufige Programmierung: Zustands-Raum Diagramme

Nebenläufige Programmierung: Zustands-Raum Diagramme

Wesentliche Zustandsänderung ist die Änderung von lokalen und globalen Speicher (Daten).
Variablen sind Bestandteil von Ausdrücken und erlauben zwei Operationen: {read,write}

var x: read(x) ⇔ RHS value(x) → ε (value(x))
       write(x,v) ⇔ LHS reference(x) → x := v

5 / 84

PD Stefan Bosse - VPP - Metriken und Verhalten von Parallelen Programmen :: Nebenläufige Programmierung: Zustands-Raum Diagramme

Beschreibung eines parallelen Programms auf Programmierebene

Der Zugriff auf globale und somit geteilte Variablen muss atomar sein, d.h. immer nur ein Prozess kann den Wert einer Variable lesen oder einen neuen Wert schreiben.
Der parallele Zugriff auf eine geteilte Ressource muss aufgelöst werden (Konflikt): i.A. mutualer Ausschluss durch Sequenzialisierung der parallelen Zugriffe!

6 / 84

PD Stefan Bosse - VPP - Metriken und Verhalten von Parallelen Programmen :: Nebenläufige Programmierung: Zustands-Raum Diagramme

Nebenläufige Programmierung: Zustands-Raum Diagramme

Beispiel

  write(X,v1) || write(X,v2) || x3:=read(X) → 
  write(X,v1); read(X,x3); write(X,v2) |
  x3=read(X);  write(X,v2); write(X,v2) | ..

Algebraisch ausgedrückt ergibt sich die Transformation:

$\frac{\begin{gathered} (WRITE(x,{v_1}) \to {p_1})\parallel \hfill \\ (WRITE(x,{v_2}) \to {p_2}) \hfill \ \end{gathered} }{\begin{gathered} (WRITE(x,{v_1}) \to (WRITE(x,{v_2}) \to ({p_1}\parallel {p_2})))| \hfill \\ (WRITE(x,{v_2}) \to (WRITE(x,{v_1}) \to ({p_1}\parallel {p_2})))| \hfill \ .. \hfill \\ \end{gathered} }$

Es gibt eine Menge von möglichen Entwicklungen des parallelen Systems!

7 / 84

PD Stefan Bosse - VPP - Metriken und Verhalten von Parallelen Programmen :: Nebenläufige Programmierung: Zustands-Raum Diagramme

Nebenläufige Programmierung: Zustands-Raum Diagramme

Instruktionen von Prozessen werden sequenziell ausgeführt. Instruktionen können auf prozesslokale und programmglobale Variablen zugreifen.

Definition eines parallelen Programms: globale Variablen (V) und Prozesse mit lokalen Variablen (v)

var V1,V2,...
process p1(a1,a2,...)   process p2(a1,a2,...)
  var v1,v2,....          var v1,v2,....
         
         
  V_i := ε(a_i,v_i,V_i)        V_i := ε(a_i,v_i,V_i)
  v_i := ε(a_i,v_i,V_i)        v_i := ε(a_i,v_i,V_i)
end                     end

8 / 84

PD Stefan Bosse - VPP - Metriken und Verhalten von Parallelen Programmen :: Nebenläufige Programmierung: Zustands-Raum Diagramme

Nebenläufige Programmierung: Zustands-Raum Diagramme

Bei einem sequenziellen Programm ist das Ergebnis einer Berechnung (d.h. die Werte aller Variablen) deterministisch allein durch die Anweisungssequenz und die Eingabedaten gegeben, und kann beliebig oft wiederholt werden - immer mit dem gleichen Ergebnis → Reihenfolge aller Anweisungen der Berechnung vorgegeben und fest
Bei einem parallelen Programm können mehrere Anweisungen verschiedener Prozesse gleichzeitig oder überlappend ausgeführt werden bzw. konkurrieren.
Die Reihenfolge parallel ausgeführter Anweisungen von einzelnen Prozessen kann hingegen undeterministisch = zufällig sein!!
Jeder der Prozesse kann als nächster den Zustand des Programms ändern.
Ein Zustands-Raum Diagramm beschreibt die Änderung des Programmzustandes als sequenzielle Auswertung aller möglichen Prozessaktivitäten.

9 / 84

PD Stefan Bosse - VPP - Metriken und Verhalten von Parallelen Programmen :: Nebenläufige Programmierung: Zustands-Raum Diagramme

Nebenläufige Programmierung: Zustands-Raum Diagramme

Das Diagramm ist ein gerichteter Graph, dessen Knoten den aktuellen Programmzustand s ∈ S beschreiben, und dessen Kanten die möglichen Zustandsübergänge beschreiben.
Es gibt einen ausgewiesen Startzustand (Initialisierung) und einen oder mehrere Endzustände.
Gibt es mehrere Endzustände liegt wohl möglich ein Entwurfsfehler vor, da das Programm unterschiedliche Endergebnisse liefern kann.

10 / 84

PD Stefan Bosse - VPP - Metriken und Verhalten von Parallelen Programmen :: Nebenläufige Programmierung: Zustands-Raum Diagramme

Algorithmus: Entwicklung des Zustands-Raum Diagramms

Es gebe ein paralleles Programms welches aus N Prozessen P={p₁,p₂,..,p_N} besteht.

Initialisiere den Startzustand s_x=s₀ und erzeuge Wurzel-Knoten s₀ im Diagramm.
Aktueller Zustand: s_x. Setze P*:=P mit P={p₁,p₂,..,p_N} als Prozessliste und S*={}
Wähle (entferne) einen beliebigen Prozess p_x aus der Prozessliste P* und setze P*:= {p_n| p_n ∈ P* ∧ p_n ∉ p_x}

11 / 84

PD Stefan Bosse - VPP - Metriken und Verhalten von Parallelen Programmen :: Nebenläufige Programmierung: Zustands-Raum Diagramme

Nebenläufige Programmierung: Zustands-Raum Diagramme

Evaluiere die nächste Instruktion i_x,n von p_x und berechne die Wirkung auf lokale und globale Variablen sowie den Instruktionszeiger I_x,n.
Erzeuge einen neuen Zustandsknoten s_j/=x , füge ihn zur Liste S*:=S* ∪ {s_j} hinzu und verbinde ihn mittels einer Kante t_x→j mit dem aktuellen Ausgangszustand s_x
Wiederhole Schritt 3 bis 5 für alle anderen verbleibenden Prozesse p ∈ P bis P*={}
Setze S**:=S*. Für jeden Knoten s_x ∈ S** wiederhole die Schritte 2 bis 6. Iteriere Schritt 7 bis alle Prozesse terminiert sind oder keine Zustandsänderung mehr auftritt.

12 / 84

PD Stefan Bosse - VPP - Metriken und Verhalten von Parallelen Programmen :: Nebenläufige Programmierung: Zustands-Raum Diagramme

Nebenläufige Programmierung: Zustands-Raum Diagramme

Beispiel

Sequenzielles Programm      Paralleles Programm
for i := 1 to 3 do i1        process p1
                               for i := 1 to 3 do i1
                             end
                             process p2
                               for j := 1 to 3 do i2
                             end

13 / 84

PD Stefan Bosse - VPP - Metriken und Verhalten von Parallelen Programmen :: Nebenläufige Programmierung: Zustands-Raum Diagramme