Verteilte und Parallele Programmierung

Mit Virtuellen Maschinen

PD Stefan Bosse

Universität Bremen - FB Mathematik und Informatik

1 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation ::

Verteile Systeme: Synchronisation und Gruppenkommunikation

Übergang von eng zu lose gekoppelten Systemen

Wo liegen die Unterschiede in der Prozesskommunikation zu eng gekoppelten SM Systemen?

Wie geschieht die Synchronisation bei Fehlern und Asynchronität?

2 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Map & Reduce

Map & Reduce

Ein Web-Programmiermodell für die skalierbare Datenverarbeitung in großen Clustern über große Datenmengen basierend auf impliziter Master-Worker Gruppenkommunikation (aber via peer-to-peer Nachrichten).
Das Modell wird häufig in Web-Scale-Search- und Cloud-Computing-Anwendungen eingesetzt.
Aber auch funktionale und parallele Programmierung macht von MapReduce Methoden Gebrauch
Methode:
- Es wird eine Map-Funktion angegeben, um eine Gruppe von Schlüssel/Wert-Zwischenpaaren zu generieren.
- Dann wird eine Reduce-Funktion auf diesen Paaren angewendet, um alle Zwischenwerte mit demselben Zwischenschlüssel zusammenzuführen.
MapReduce ist hochgradig skalierbar, um hohe Parallelitätsgrade auf verschiedenen Arbeitsebenen zu erreichen.

3 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Map & Reduce

Map & Reduce

Ein typischer MapReduce-Berechnungsprozess kann Terabytes an Daten auf Zehntausenden oder mehr Client-Computern verarbeiten. Hunderte von MapReduce-Programmen können gleichzeitig ausgeführt werden.
- Tatsächlich werden jeden Tag Tausende von MapReduce-Jobs in Clustern von Google ausgeführt.
- Das Hadoop Framework bietet für WEB Anwendungen MapReduce Services an → Master-Slave Architektur!

Die Map-Funktion verarbeitet ein Paar (Schlüssel, Wert) und gibt eine Liste von Zwischenpaaren (Schlüssel, Wert) zurück:

$map({k_1},{v_1}) \to list({k_2},{v_2})$

Die Reduzierungsfunktion führt alle Zwischenwerte zusammen, die die gleichen Zwischenschlüssel haben:

$reduce({k_2},list({v_2})){\text{ }} \to {\text{ }}list({v_3})$

4 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Map & Reduce

Map & Reduce

Ausführungsphasen einer generischen MapReduce Applikation

5 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Map & Reduce

Map & Reduce

MapReduce Phasen

Ein Master-Prozess erhält einen Jobdeskriptor, der den auszuführenden MapReduce-Job angibt. Der Jobdeskriptor enthält neben anderen Informationen den Ort der Eingabedaten, auf die unter Verwendung eines verteilten Dateisystems zugegriffen werden kann.
Gemäß dem Jobdeskriptor startet der Master eine Anzahl von Mapper- und Reducer-Prozessen auf verschiedenen Maschinen. Gleichzeitig startet es einen Prozess, der die Eingabedaten von seinem Speicherort liest, diese Daten in eine Gruppe von Aufteilungen unterteilt und diese Aufteilungen an verschiedene Zuordner verteilt.
Nach dem Empfang seiner Datenpartition führt jeder Zuordnungsvorgang die Zuordnungsfunktion aus (die als Teil des Jobdeskriptors bereitgestellt wird), um eine Liste von Zwischenschlüssel / Wert-Paaren zu erzeugen. Dann werden diese Paare auf der Basis ihrer Schlüssel gruppiert.

6 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Map & Reduce

Map & Reduce

Alle Paare mit den gleichen Schlüsseln sind dem gleichen Reduziervorgang zugeordnet. Daher führt jeder Reduzierprozess die Reduktionsfunktion (definiert durch den Jobdeskriptor) aus, die alle Werte vereinigt, die mit dem gleichen Schlüssel assoziiert sind, um einen möglicherweise kleineren Satz von Werten zu erzeugen.
Dann werden die von jedem Reduktionsprozess erzeugten Ergebnisse gesammelt und an einen durch den Jobdeskriptor spezifizierten Ort geliefert, um die endgültigen Ausgabedaten zu bilden.

7 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Map & Reduce

Map & Reduce

Beispiel

local options = {workers = 2}
local data = {34,35,36,37,38,39,40,41}
local function worker (id,set)
  local results = T{}
  for i = 1,#set do
    results:push(fib(set[i]))
  end
  return results
end
-- Parallel Processing
local Parallel = require('parallel')
local p = Parallel:new(data,options)
function sum (x,y) return x+y  end
p:time():
  map(worker):
  apply(function (r) print(r:print()) end):
  reduce(sum):
  apply(print):
  time()

8 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Gruppenkommunikation

Gruppenkommunikation

Die bisherigen Synchronisationsmethoden basierten auf einem sicheren Lock Objekt und Master-Worker Hierarchien
Verteilte Systeme sind i.A. strikt asynchron und können nicht direkt synchronisiert werden
Der verteile mutuale Ausschluss ist zentrales Problem in verteilten Systemen
In verteilten Systemen kann es lose gekoppelte Gruppen aus Prozessen geben und es muss zunächst ein Master/Leader gewählt werden!

9 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: MPI

MPI

Message Passing Interface: MPI

Ziele und Eigenschaften

Anwendungsprogrammierschnittstelle (nicht unbedingt für Compiler oder eine Systemimplementierungsbibliothek).
Effiziente Kommunikation:
- Vermeidung von Arbeitsspeicher-Arbeitsspeicher Kopien
- Überlappung von Berechnung und Kommunikation
- Auslagerung auf Kommunikations-Koprozessoren, soweit verfügbar.

10 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: MPI

MPI

Implementierungen, die in einer heterogenen Umgebung verwendet werden können (verschiedene Hostplattformen).
Einfache Einbindung in Programmiersprachen und Bibliotheken und Plattformunabhängigkeit
Zuverlässige Kommunikation: Nutzer/Programmierer muss sich nicht um Kommunikationsfehler kümmern

11 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: MPI

MPI

API

Point-to-point communication,
Datatypes,
Collective operations,
Process groups,
Communication contexts,
Process topologies,
Environmental management and inquiry,
The Info object,
Process creation and management,
One-sided communication,
External interfaces,
Parallel file I/O,

12 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: MPI

MPI

Operationen

13 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: MPI

MPI

Communicator

Kommunikationswelt mit einer Gruppe aus Prozessen die gemeinsam Nachrichten austauschen können
Nachrichten können nur innerhalb der Kommunikationswelt ausgetauscht werden
MPI_COMM_WORLD ist die Standardwelt

14 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: MPI

MPI

Rank (Rang)

Einheitliche Prozessnummer innerhalb einer Kommunikationswelt
Werden vom System bei der Initialisierung vergeben und werden fortlaufend ab 0 nummeriert
Rank IDs werden bei der Kommunikation zur Identifikation von Empfänger und Sender verwendet (Kommunikationsendpunkte)
Rank IDs dienen zur Programmdifferenzierung (if rank==0 then do this else do that)

15 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: MPI

MPI

Point-to-Point Kommunikation

Kommunikation zwischen zwei Prozessen
Quellprozess sendet eine Nachricht (Typ, Daten) an einen Zielprozess unter Angabe der Rank ID
Kommunikation kann nur innerhalb eines Communicators stattfinden

MPI.send(dest:number,message:{type:string,content:string})

16 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: MPI

MPI

Damit der Zielprozess die Nachricht empfangen kann muss er einen Handler für den entsprechenden Nachrichtentyp einrichten:

MPI.recv(type:string,callback:function (message))

17 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: MPI

MPI

Broadcast Kommunikation

Ein Quellprozess kann eine Nachricht an alle Prozesse innerhalb eines Communicators senden

MPI.broadcast(message:{type:string,content:string})

18 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: RPC

RPC

Remote Procedure Call Interface

Ähnlich MPI
Klienten-Server Architektur
Es gibt drei Operationen:
- getreq → Server; Auf eine Anfrage warten
- putrep → Server: Eine Annfrage beantworten
- trans → Klient: Eine Anfrage senden und auf Antwort warten

19 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: RPC

RPC

LUA API (CSP)

Die Kommmunikation findet über das IP-UDP/TCP Protokoll statt.
Daten werden serialisiert und es können beliebige Daten übertragen werden (inkl. seitenfreier Funktionen)

Rpc(options?:{}) → rpc: Erzeugt eine RPC Instanz (für Klient und Server)

rpc:getreq(ip:string,port:number,callback:function (req) → rep): Server Handlerfunktion (putrep wird implizit mit dem Rückgabewert des Callbackhandlers ausgeführt)

rpc:trans(ip_string,port:number,request:*) → reply:*: Klienten Transaktion

20 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: RPC

RPC

Beispiel

// Server
require('Csp')
local rpc = Rpc({verbose=2})
rpc:getreq('127.0.0.1',12345,function (req)
  if req.cmd=='iabs' then
    return {
     result=math.sqrt(math.pow(req.x,2)+
                      math.pow(req.y,2)),
     stat='OK'
    }
  else return {stat='EINVALID'} end
end)
loop.start()

// Client
require('Csp')
local rpc = Rpc({verbose=2})
local stat,reply = rpc:trans('127.0.0.1',12345,
                             {cmd='iabs',x=1,y=2})
print(reply)

21 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Tupelräume

Tupelräume

Tupel-Räume stellen ein assoziiertes Shared-Memory-Modell dar, wobei die gemeinsam genutzten Daten als Objekte mit einer Reihe von Operationen betrachtet werden, die den Zugriff der Datenobjekte unterstützen
Tupel sind in Räumen organisiert, die als abstrakte Berechnungsumgebungen betrachtet werden können.
Ein Tupelraum verbindet verschiedene Programme, die verteilt werden können, wenn der Tupel-Space oder zumindest sein operativer Zugriff verteilt ist.
- Oder: Mobile Rechner als Tupel Verteiler!
Das Tupelraum Organisations- und Zugangsmodell bietet generative Kommunikation, d.h. Datenobjekte können in einem Raum durch Prozesse mit einer Lebensdauer über das Ende des Erzeugungsprozesses hinaus gespeichert werden.
Ein bekanntes Tupelraum-Organisations- und Koordinationsparadigma ist Linda [GEL85].

22 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Tupelräume

Tupelräume

Ein Schnappschuss eines Tupelraumes mit Tupeln und Tupeloperationen [11]

23 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Tupelräume

Tupelräume

Kommunikation von Sensorknoten über Tupelräume ist eine Koordionierungssprache.

Direkter Nachrichtenaustausch (a), z.B. durch Signale, im Vergleich zu generativer Kommunikation (b) und virtuelle verteilte Räume (c) durch mobile Prozesse (Sensorknoten)

24 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Tupelräume - Datenmodell

Tupelräume - Datenmodell

Die Daten sind mit Tupeln organisiert.
Ein Tupel ist eine lose gekoppelte Verbindung einer beliebigen Anzahl von Werten beliebiger Art /Typ/
Ein Tupel ist ein Wert und sobald es in einem Tupelraum gespeichert ist, ist es persistent.
Tupeltypen ähneln den Datenstrukturtypen, sie sind jedoch dynamisch und können zur Laufzeit ohne statische Beschränkungen erstellt werden.
Auf die Elemente von Tupeln kann nicht direkt zugegriffen werden, was üblicherweise Mustererkennung und musterbasierte Dekomposition erfordert, im Gegensatz zu Datenstrukturtypen, die einen benannten Zugriff auf Feldelemente bieten, obwohl die Behandlung von Tupeln als Arrays oder Listen diese Beschränkung lösen kann.
Ein Tupel mit n Feldern heißt n-stellig und wird in der Notation <v₁, v₂, ..> angegeben.

25 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Tupelräume - Datenmodell

Tupelräume - Datenmodell

Beispiele von Tupel

<'SENSOR',1000>
<'SENSOR2',[10,100,2]>
<1,3,5,7,11>
<'SLEEPMODE',True,2500.34>
<0,'OFF'>
<1,'ON'>

Formal werden Tupel als Vektoren durch die folgende Generierungsregel mit Werten v, Ausdrücken ε und Variablen x definiert, die als tatsächliche Parameter betrachtet werden (d.h. Variablen x, die mit Wertsemantik verwendet werden):

$t = \left\langle {\overrightarrow d } \right\rangle {\text{, with }}\overrightarrow d :: = d|d,\overrightarrow d {\text{ and }}d:: = v|\varepsilon |x$

26 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Tupelräume - Datenmodell

Tupelräume - Datenmodell

Tupelwerte erfordern einen Mustervergleich basierend auf dem Vorlagenmuster mit der folgenden Generierungsregel, bestehend aus tatsächlichen (v, ε, x) und formalen Parametern (x?, Variablen, die mit Referenzsemantik verwendet werden):

$p = \left\langle {\overrightarrow {dt} } \right\rangle {\text{, with }}\overrightarrow {dt} :: = dt|dt,\overrightarrow {dt} {\text{ and }}dt:: = v|\varepsilon |x|x?| \bot$

Ein Suchmuster kann ein Wildcard (⊥) anstelle von formalen Parametern verwenden.
Jedes Tupel t hat eine Typsignatur Sig (t) = S_t = <T₁; T₂; ...; T_n>, ein Tupel mit der gleichen Stelligkeit wie t, das den Typ jedes Tupelfeldes angibt.
Ein Tupel kann nur durch seine Verknüpfung mit Templates p angesprochen werden.

27 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Tupel Räume - Datenmodell

Tupel Räume - Datenmodell

Üblicherweise wird das erste Feld eines Tupels als symbolischer Schlüssel behandelt, der eine Tupelunterklasse identifiziert, indem Textzeichenfolgen oder aufgezählte symbolische Konstantenwerte verwendet werden.

Mustersuche

Sei t = <d₁, d₂, .., d_n> ein Tupel, p = <dt₁, dt₂, .., dt_m> eine Vorlage; dann wird t durch p abgedeckt (bezeichnet durch match (t, p) = true), wenn die folgenden Bedingungen gelten: (i) m = n. (ii) ∀ dt_i = d_i oder dt_i = ⊥, 1 ≤ i ≤ n. Bedingung (1) prüft, ob t und p die gleiche Stelligkeit haben, während (2) prüft, ob jedes Nicht-Wildcard-Feld von p gleich ist dem entsprechenden Feld von t. Mustersuche

28 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Tupelräume - Operationale Semantik

Tupelräume - Operationale Semantik

Es gibt eine Reihe von Operationen, die von Prozessen angewendet werden können, bestehend aus
- einer Reihe reiner Datenzugriffsoperationen, die Tupel als passive Datenobjekte behandeln,
- und Operationen, die Tupel als eine Art von aktiven Rechenobjekten behandeln (genauer gesagt, zu berechnende Daten).
- RPC-Semantik (Remote Procedure Call).

out(t): Die Ausführung der Ausgabeoperation fügt das Tupel t in den Tupelraum ein. Mehrere Kopien desselben Tupelwerts können eingefügt werden, indem die Ausgabeoperation iterativ angewendet wird. Die gleichen Tupel können nach dem Einfügen in den Tupelraum nicht unterschieden werden.

Beispiel: out("Sensor",1,100); out("Sensor",2,121);

29 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Tupelräume - Operationale Semantik

Tupelräume - Operationale Semantik

inp(p): Die Ausführung der Eingabeoperation entfernt ein Tupel t aus dem Tupelraum, der der Mustervorlage p entspricht. Wenn kein passendes Tupel gefunden wird führt das zu einer Blockierung des aufrufenden Prozesses bis ein passendes Tupel eingestellt wird.

Beispiel: inp("Sensor",1,s1?); inp("Sensor",i?,s?);

rd(p): Die Ausführung der Leseoperation gibt eine Kopie eines Tupels t zurück, dass der Vorlage p entspricht, entfernt sie jedoch nicht. Wenn kein passendes Tupel gefunden wird führt das zu einer Blockierung des aufrufenden Prozesses bis ein passendes Tupel eingestellt wird.

Beispiele: rd("Sensor",1,s1?); rd("Sensor",i?,s?);

30 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Tupelräume - Operationale Semantik

Tupelräume - Operationale Semantik

inp?(p), rd?(p): Nichtblockierende Version von inp/rd. Wird kein passendes Tupel gefunden wird die Operation ergebnislos terminiert.

Beispiel: res:=inp?('SENSOR',a?,b?);

inpw?(tmo,p), rdw?(tmo,p): Teilblockierende Version von inp/rd, Wird einer Zeit von tmo kein passendes Tupel gefunden wird die Operation abgebrochen.

Beispiel: res:=inpw?(1000,'SENSOR',a?,b?);

Die Verwendung von zeitlich unbegrenzt blockierenden Operationen kann unter Betrachtung der Lebendigkeit von Agenten nachteilig sein. Daher sollte immer eine zeitliche Begrenzung und anschließende Abfrage des Operationsstatus erfolgen (abgebrochen?)

31 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Tupelräume - Operationale Semantik

Tupelräume - Operationale Semantik

test(t), testandset(p,function (t)→t): Nicht blockierender Test eines Tupels und atomare Veränderung eines Tupels, dass der Vorlage p entspricht. Das zweite Argument ist eine Abbildungsfunktion. Das Ergebnistupel ersetzt das ursprüngliche.

Markierungen

Tupel sind persistent und können für immer in einem Tupelraum verbleiben!
Daher ist die Verwendung von Markierungen häufig sinnvoll.
Eine Markierung ist ein Tupel mit einer Lebenszeit τ
Nach Ablauf der Lebenszeit wird das Tupel - sofern es nicht entfernt wurde - durch einen Garbagecollector entfernt.

$m = \left\langle {\tau ,\overrightarrow d } \right\rangle {\text{, with }}\overrightarrow d :: = d|d,\overrightarrow d {\text{ and }}d:: = v|\varepsilon |x,{\text{ }}\tau :{\text{timeout}}$

32 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Tupelräume - Operationale Semantik

mark(tmo,t): Ausgabe eines Tupels t mit einer Lebenszeit τ (im Tupelraum).

33 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Tupelräume - Synchronisationsmodell

Tupelräume - Synchronisationsmodell

Es gibt Produzenten- (Generator) und Verbraucherprozesse.

Ein Produzent erzeugt ein Tupel, das von einem Konsumentenprozess entfernt werden kann.
- Die Tupelausgabeoperation endet unmittelbar (asynchron), alternativ nachdem das Tupel im Tupelraum gespeichert wurde (synchron).
Ein Verbraucher-Prozess wird blockiert, wenn die Anfrage nicht bearbeitet werden kann, wenn im Tupel-Bereich tatsächlich kein passendes Tupel vorhanden ist.
Nachdem ein übereinstimmendes Tupel im Tupelraum gespeichert wurde, wird es sofort einen der wartenden Verbraucherprozesse zugewiesen.

34 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Tupelräume - Synchronisationsmodell

Daher ist die Eingabeoperation immer synchron. Einzige Ausnahme sind die nicht permanent blockierenden Versionen, die das Warten auf eine obere Zeitgrenze begrenzen (Timeout).
Es gibt keine anfängliche zeitliche Anordnung von Erzeuger- und Verbraucheroperationen.

35 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Tupelräume - Beispiele von Operationen in Lua

Tupelräume - Beispiele von Operationen in Lua

out({'SENSOR',10,20});
out({'SENSOR',9,23{);
out({'PI',3,14{);
out({'DATA',{1,2,3,4}});
result = inp({'SENSOR',nil,nil});
>> { 'SENSOR', 9, 23 }
result = inp({'SENSOR',nil,nil});
>> { 'SENSOR', 10, 20 }
inp({'SENSOR',nil,nil});
>> nil
rd({nil,nil})
>> { 'DATA', { 1, 2, 3, 4 } }
rd({nil,nil,nil,nil},100)
>> nil -- Timeout

36 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Sicherheit und Lebendigkeit

Sicherheit und Lebendigkeit

Ein Algorithmus, z.B. die Wahl eines Leaders in einer Prozessgruppe, gelte als sicher wenn maximal ein Leader unter allen Umständen gewählt wird. Dies ist auch der Fall wenn einzelne Prozesse der Prozessgruppe fehlerhaft sind (nicht erreichbar sind oder terminiert sind).
Ein Algorithmus, z.B. die Wahl eines Leaders in einer Prozessgruppe, gelte als lebendig wenn irgendwann mindestens ein Leader unter allen Umständen gewählt wird.

Robustheit und Fehler

Angenommen eine Prozessgruppe bestehe aus N Prozessen die in einem Netzwerk verteilt sind.
Die Netzwerkknoten sind miteinander verbunden.
Nun wird aufgrund einer technischen Störung das Netzwerk partitioniert (z.B. in zwei getrennte Bereiche geteilt).

37 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Sicherheit und Lebendigkeit

Sicherheit und Lebendigkeit

Der verteilte Algorithmus wird in jeder der Partitionen unabhängig arbeiten. Dann ist das verteilte System zwar noch lebendig (es werden unabhängig zwei Leader in den Gruppenpartitionen gewählt), aber nicht mehr sicher !!!!
- Die Invariante des Algorithmus ist verletzt worden durch Ausfall/Störung!

Leaderelection: Eine ursprünglich zusammenhängende Gruppe wird durch Netzwerkpartitionierung (Störung der Kommunikation) zweigeteilt und es werden jetzt zwei Leader gewählt!

38 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Mutualer Ausschluss

Mutualer Ausschluss

Verteilter Algorithmus nach Lamport

LA1: Um einen kritischen Bereich zu erlangen (Mutex Acquire), sendet ein Prozess eine zeitgestempelte Anforderung an jeden anderen Prozess im System und fügt die Anforderung auch in seiner lokalen Queue Q hinzu.

LA2: Wenn ein Prozess eine Anforderung empfängt, wird sie in Q platziert. Wenn sich der Prozess nicht in seinem CS befindet, sendet er eine zeitgestempelte Bestätigung an den Absender. Andernfalls wird das Senden der Bestätigung bis zum Verlassen des CS verzögert (Mutex Release).

39 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Mutualer Ausschluss

Mutualer Ausschluss

LA3: Ein Prozess tritt in seinen CS ein, wenn (1) seine Anfrage vor allen anderen Anfragen (d.h. der Zeitstempel seiner eigenen Anfrage ist kleiner als die Zeitstempel aller anderen Anfragen) in seinem lokalen Q angeordnet ist und (2) Es hat die Antworten von jedem anderen Prozess als Antwort auf seine aktuelle Anfrage erhalten.

LA4: Um die CS zu verlassen, löscht ein Prozess (1) die Anfrage von seiner lokalen Warteschlange Q und (2) sendet eine zeitgestempelte Freigabenachricht an alle anderen Prozesse.

LA5: Wenn ein Prozess eine Freigabenachricht erhält, entfernt er die entsprechende Anforderung aus seiner lokalen Warteschlange Q.

40 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Mutualer Ausschluss

Mutualer Ausschluss

Verteilter Algorithmus nach Ricart–Agrawala’

Verbesserte Version

RA1: Jeder Prozess, der den Eintritt in seinen CS anfordert (Mutex Acquire), sendet eine zeitgestempelte Anfrage an jeden anderen Prozess im System.

RA2: Ein Prozess, der eine Anforderung empfängt, sendet eine Bestätigung an den Absender zurück, nur wenn

(1) der Prozess nicht an dem Eintritt in seinen CS interessiert ist (Mutex Acquire) oder
(2) der Prozess versucht, seine CS zu erlangen, aber sein Zeitstempel größer ist als der des Absenders.
Wenn sich der Prozess bereits in seinem CS befindet (besitzt den Lock) oder sein Zeitstempel kleiner als der des Absenders ist, puffert er alle Anforderungen bis zum Verlassen des CS.

41 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Mutualer Ausschluss

Mutualer Ausschluss

RA3: Ein Prozess tritt in seine CS ein, wenn er von jedem der verbleibenden (n-1) Prozesse eine Bestätigung erhält.

RA4: Nach dem Verlassen seiner CS muss ein Prozess eine Rückmeldung an jede der ausstehenden Anfragen senden, bevor er eine neue Anfrage macht oder andere Aktionen ausführt.

42 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Mutualer Ausschluss

Mutualer Ausschluss

Token Algorithmen

Eine andere Klasse verteilter mutualer Ausschlussalgorithmen verwendet das Konzept eines expliziten variablen Tokens, das als eine Erlaubnis für den Eintritt in die CS dient (Mutex Acquire) und von einem anfordernden Prozess durch das Prozesssystem weitergereicht werden kann.
Immer wenn ein Prozess in seinen CS eintreten möchte, muss er den Token erwerben. Der erste bekannte Algorithmus, der zu dieser Klasse gehört, ist auf Suzuki und Kasami zurückzuführen.
Da es nur ein Token gibt ist der mutuale Ausschluss (Sicherheit) garantiert. Die Lebendigkeit aber nicht unbedingt (Verlust des Tokens).

43 / 58

PD Stefan Bosse - VPP - Verteile Systeme: Synchronisation und Gruppenkommunikation :: Mutualer Ausschluss