Verteilte und Parallele Programmierung

Mit Virtuellen Maschinen

Prof. Dr. Stefan Bosse

Universität Koblenz - FB Informatik - FG Praktiksche Informatik

1 / 31

Stefan Bosse - VPP - Modul C Parallele und Verteilte Zelluläre Automaten ::

Parallele und Verteilte Zelluläre Automaten

Wie kann das ZA Modell für die Parallelisierung und Verteilung genutzt werden?

2 / 31

Stefan Bosse - VPP - Modul C Parallele und Verteilte Zelluläre Automaten ::

Parallele und Verteilte Zelluläre Automaten

Wie kann das ZA Modell für die Parallelisierung und Verteilung genutzt werden?

Wie können geteilte und verteilte Speichermodelle sinnvoll eingesetzt werden?

3 / 31

Stefan Bosse - VPP - Modul C Parallele und Verteilte Zelluläre Automaten ::

Parallele und Verteilte Zelluläre Automaten

Wie kann das ZA Modell für die Parallelisierung und Verteilung genutzt werden?

Wie können geteilte und verteilte Speichermodelle sinnvoll eingesetzt werden?

Wie muss die Synchronisation aussehen? Synchron versa Asynchrone Ausführung

4 / 31

Stefan Bosse - VPP - Modul C Parallele und Verteilte Zelluläre Automaten ::

Parallele und Verteilte Zelluläre Automaten

Wie kann das ZA Modell für die Parallelisierung und Verteilung genutzt werden?

Wie können geteilte und verteilte Speichermodelle sinnvoll eingesetzt werden?

Wie muss die Synchronisation aussehen? Synchron versa Asynchrone Ausführung

Wie kann CALUA parallelisiert werden?

5 / 31

Stefan Bosse - VPP - Modul C Parallele und Verteilte Zelluläre Automaten :: Arten von ZA

Arten von ZA

Klassische ZA
- Statische Regeln
- Statische Nachbarschaft
Neuronale ZA
- Kombiniert ZA Strukturen mit Neuronalen Netzwerken
- Maschen- oder Gitterperzeption
Differenzierbare Logik ZA

6 / 31

Stefan Bosse - VPP - Modul C Parallele und Verteilte Zelluläre Automaten :: Neuronale Zelluläre Automaten

Neuronale Zelluläre Automaten

Horibe et al., arXiv:2206.06674 Architekture eines NZA: Die nachbarschaftszellen liefern die Eingabe für ein Perzeptron dessen Ausgabe den nächsten Zustand der zelle bestimmt.

7 / 31

Stefan Bosse - VPP - Modul C Parallele und Verteilte Zelluläre Automaten :: Ausführungsmodell

Ausführungsmodell

Synchron mit Zentraltakt
Synchron in Phasen
Asynchron in Phasen
Asynchron

8 / 31

Stefan Bosse - VPP - Modul C Parallele und Verteilte Zelluläre Automaten :: Anforderungen

Anforderungen

Die Taxonomie paralleler und verteilter Anwendungen bezieht sich auf Daten- und Anwendungsklassen, z.B.,

Datenklassen: Vektor-, Matrix-, Tensor-, Funktionsdaten (zelluläre Automaten);
Algorithmenklassen: Matrixoperationen im Allgemeinen, datengetriebene und iterative Optimierungsprobleme, Zelluläre Automatenverarbeitung, Simulation, Gleichungslösung, Regression, Statistische Analyse;
Datenabhängigkeitsklassen: Lokaler, globaler, gruppierter, statischer und dynamischer Inhalt, statische und dynamische Größen sowie horizontale (zeitliche) und vertikale Abhängigkeiten;
Verarbeitungsflussklassen: Datenfluss ⇔ Funktionsfluss, Kontrollfluss ⇒ Synchronisation;
Partitionierungsklassen: Einzeldaten- und Einzelmodell- versa Mehrdaten- und Mehrmodellberechnung (z. B. Ensemblemodell ML mit Modellfusion, Datenströme);

9 / 31

Stefan Bosse - VPP - Modul C Parallele und Verteilte Zelluläre Automaten :: Anforderungen

Anforderungen

Modellklassen: Datengetriebene Modellierung, z. B. unter Verwendung von ML-Methoden, aufgeteilt in Trainings-, Test- und Validierungsphasen, Hypothesentest und Modellauswahl (parallel), Exploration (Suche) in einem Modellraum, Exploration (Suche) in einem Hyperparameterraums;
Größenklassen: Statische Größe versa Probleme mit dynamischer (wachsender) Größe.

10 / 31

Stefan Bosse - VPP - Modul C Parallele und Verteilte Zelluläre Automaten :: Das 1:1 Modell

Das 1:1 Modell

Die einzelnen Zellen eines ZA sind zunächst völlig unabhängig voneinander → Kontrollpfadparallelität
Die Datenabängigkeit einer Zelle ist auf die Zellen seiner unmittelbaren Umgebung beschränkt → Kurzreichweitige Datenabhängigkeit
Synchronisation erfolgt primär (implizit) durch einen zentralen Takt, der aber nur die einzelnen Phasen des ZA (before, activity, after) einleitet.
Weitere implizite Synchronisation beim Zugriff auf Zustand (Variablen) von Nachbarzellen

11 / 31

Stefan Bosse - VPP - Modul C Parallele und Verteilte Zelluläre Automaten :: Das 1:1 Modell

(a) Das parallele (oder verteilte) 1:1 ZA Modell wo jede Zelle von einem physischen Prozessor ausgeführt wird → Verteiltes Speichermodell (b) Das partitionierte 1:N ZA Modell wo ein Bereich des ZA von einem Prozessor ausgeführt wird → Geteiltes und verteiltes Speichermodell

12 / 31

Stefan Bosse - VPP - Modul C Parallele und Verteilte Zelluläre Automaten :: Das 1:1 Modell

Das 1:1 Modell

Das 1:1 Modell ist nur in digitalen Hardwaresystemen sinnvoll. Es ist der Overhead der Kommunikation und Synchronisation zu beachten!

Ein Zustandsautomatmit Register-Transfer Logik: Kontroll- und Datenpfad sind hier getrennt und statisch (nicht progranmmierbar), d.h. programmspezifisch.

13 / 31

Stefan Bosse - VPP - Modul C Parallele und Verteilte Zelluläre Automaten :: Das Partitionsmodell

Das Partitionsmodell

Partitionierung der Zellen des ZA in parallele Felder:
- Jedes Feld besteht aus einer Gruppe aus Zellen F_i={z∈Z} ⊂ Z für sich: Ein P mit SM, Zellen eng gekoppelt
- Alle Felder: Verteilter Zellenrechner, Multi-P, Felder lose gekoppelt über Verteilten und geteilten Speicher (DSM)
Man unterscheidet:
- Kernbereiche eines Feldes (Untergruppe von Zellen aus F) mit reinem SM Modell, und
- Überlappende Randbereiche mit DM Modell
Es gibt weiterhin einen gemeinsamen Takt (Synch.)

14 / 31

Stefan Bosse - VPP - Modul C Parallele und Verteilte Zelluläre Automaten :: Das Partitionsmodell

Partitionierter ZA mit gemischten SM und DSM Modellen (Kern- und Randbereiche)

15 / 31

Stefan Bosse - VPP - Modul C Parallele und Verteilte Zelluläre Automaten :: Parallele Programmierung des ZA

Parallele Programmierung des ZA

Da das Speichermodell der Kern- und Randzellen unterschiedlich ist müsste explizit bei der Programmierung zwischen Zellen im eigenen Feld und im Nachbarfeldern unterschieden werden!

Die Kommunikation bei Zellen innerhalb eines Feldes ist ein direkter Speicherzugriff,
- bei verteilten Feldern (physisch getrennte Rechner) ein Nachrichtenversand (DSM),
- und bei SM auf einem Parallelrechner (Multi-core Rechner) wieder ein direkter Speicherzugriff, aber bei Verwendung einer VM auf ein spezielles geteiltes Speicherobjekt!

16 / 31

Stefan Bosse - VPP - Modul C Parallele und Verteilte Zelluläre Automaten :: Strukturierter Geteilter Speicher

Strukturierter Geteilter Speicher

Auf geteilten Speicher (Shared Memory) kann durch direkten Speicherzugriff das Lesen und Schreiben von Speicherzellen erfolgen - zunächst aber keine Datenstrukturierung, reiner Byte Speicher
Zusammengesetzte Daten (Arrays, Recors, Hashtabellen usw.) können prinzipiell über die Startadresse im Speicher von verschiedenene Prozessen direkt genutzt werden.
Virtuelle Maschinen könnten Datenstrukturen über SM teilen.

Aber: Wenn es automatisches Speichermanagement gibt können Datenstrukturen im Speicher verschoben werden (Dynamische Speicheradressen). Statische Adressen sind erforderlich.

17 / 31

Stefan Bosse - VPP - Modul C Parallele und Verteilte Zelluläre Automaten :: Strukturierter Geteilter Speicher

Strukturierter Geteilter Speicher

Strukturierter Geteilter Speicher bedarf daher einer Serialisierung und Deserialisierung von Daten.

Serialisierung: Interne (binäre) Datenstrukturen werden in ein austauschbares Format übersetzte und von einer VM A zu einer anderen VM B übertragen (oder direkt im geteilten Speicher abgelegt)

Deserialisierung: Das austauschbare Datenformat (z.B. JSON) wird wieder in interne Datenstrukturen übersetzt.

Aber: Hier haben wir dann wieder ("teure") nachrichtenbasierte Kommunikation

Besser: Die Struktur von Daten wird direkt im geteilten Speicher abgebildet und über Funktionen oder Monitore wird die Vm Datenstruktur auf die geteilte und vereinheitlichte Datenstruktur abgebildet ⇒ Strukturierter Geteilter Speicher

18 / 31

Stefan Bosse - VPP - Modul C Parallele und Verteilte Zelluläre Automaten :: Strukturierter Geteilter Speicher

Strukturierter Geteilter Speicher

Bosse, Appl.Sci. SI PC, MDPI, 2022 Architektur für gemeinsam genutzte strukturierte Speicherobjekte und programmatischer Zugriff über Proxy Funktionen (Monitore)

19 / 31

Stefan Bosse - VPP - Modul C Parallele und Verteilte Zelluläre Automaten :: Strukturierter Geteilter Speicher

Strukturierter Geteilter Speicher

Viele VM unterstützen dynamisch typisierte Programmierung (Lua, Python, JavaScript). Für einen strukturierten geteilten Speicher brauchen wir zwingend statische Typisierung.

Die geteilten Datenstrukturen müssen also explizit erzeugt werden, eine direkte Konvertierung von internen durch dynamsiche Typsignaturen geprägte Daten ist nicht möglich.

typesDefs = {
  xy = {
    x='int',
    y='int'
  }
}
sm = BufferSegment:new(1000)
( erzeugt Array mit Datenstrukturen {x,y} )
o  = BufferSegment:object(sm,typesDefs.xy,10)
a  = BufferSegment:AddrOf(o)
o[1].x = 100

Prototypische Beispiel einer SSM API. Die Adresse a kann an einen anderen VM Prozess übergeben werden.

20 / 31