PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul I: Inverse Modellierung
In der Soziologie PD Stefan Bosse
Universität Bremen - FB Mathematik und Informatik
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul I: Inverse Modellierung
Meistens kann ein Modell M(X):X → Y empirisch bestimmt werden
Häufig ist das inverse Modell von Bedeutung: M-1Y: Y → X!
ML bietet Möglichkeit "Prädiktives Modellieren"
Aber wie kann man M-1 aus M ableiten?
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul I: Inverse Modellierung
Gegeben sei eine Funktion f(x): ℝ → ℝ: x → y, z.B.
Die Bestimmung der inversen Funktion kann häutig durch einfache algebraische Umformung generell und exakt berechntet werden:
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul I: Inverse Modellierung
arcsin(z)=∞∑n=0(2n−1)!!z2n+1(2n)!!(2n+1)
Inverse Probleme sind nicht trivial (zu lösen)!
Wie sieht es bei multivariaten Funktionen aus?
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul I: Inverse Modellierung
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul I: Inverse Modellierung
Intervallarithmetik → D.h. eine Variable x wird nur in einem Intervall [a,b] betrachtet (und f)
Diskretisierung des Intervalls; [a,b] → { a, a+δ , a+2δ ,.., b}
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul I: Inverse Modellierung
Problemf(x1,x2) = y = x1+x2x1 = { 1,2,3 }x2 = { 1,2,3 }y = { 2,3,..,6 }Randbedingungen x1 ≥ 1 ∧ x1 ≤ 3 x2 ≥ 1 ∧ x2 ≤ 3 x1 = 1 ∨ x1 = 2 ∨ x1 = 3 x2 = 1 ∨ x2 = 2 ∨ x2 = 3 y = x1+x2
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul I: Inverse Modellierung
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul I: Inverse Modellierung
Ein SLP (künstliches Neuron) besteht aus zwei verbundenen Funktionsblöcken (Summierer und Aktiverungsfunktion)
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul I: Inverse Modellierung
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul I: Inverse Modellierung
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul I: Inverse Modellierung
https://hci.iwr.uni-heidelberg.de/vislearn/inverse-problems-invertible-neural-networks/
Ausgangspunkt: Ein- und Ausgabedaten besitzen die gleiche Dimension!
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul I: Inverse Modellierung
Die Eingabedaten werden augespalten in [u1,u2] und durch die gelernten Funktionen si und ti transformiert und in Wechselanordnung gekoppelt. Die Ausgabe ist die Verkettung der resultierenden Teile [v1,v2]. ⊙ - Elementweise Multiplikation
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul I: Inverse Modellierung
Invertierung des Netzwerks. Mit einer Umschaltung können [u1,u2] aus [v1,v2] wiederhergestellt werden, um die Umkehrung der gesamten affinen Kopplungsschicht zu berechnen. ∅ - Elementweise Division
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul I: Inverse Modellierung
Entscheidend ist, dass die Transformationen si und ti selbst nicht invertierbar sein müssen und durch beliebige neuronale Netze dargestellt werden können, die durch standardmäßige Backpropagation entlang des Berechnungsgraphen trainiert werden.
D.h. die Eingabedimension ist wie üblich viel größer als die Ausgabedimension!
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul I: Inverse Modellierung
Dimensionsreduzierende Abbildung x → y
Mehrdeutigkeit zwischen y und x
Eine zusätzliche latente Variable z wird eingeführt, die die Information erfasst, die sonst im Forward-Prozess verloren gehen würde. Folglich, x ↔ [y,z] wird eine bijektive Zuordnung.
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul I: Inverse Modellierung
Durch zusätzliche latente Variable z wird die inverse Abbildung "vervollständigt"
z muss unabhängig von y sein und muss einer einfachen Stichprobenverteilung N(0,1) folgen.
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul I: Inverse Modellierung
Die Verteilung p(x|y) kann angenähert werden, indem einfach wiederholt z abgetastet wird und die rückgerichtete Berechnung des Netzwerks durchgeführt wird, d.h. [y,z] → x.
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul I: Inverse Modellierung
Das Training von Vorwärtsmodellen ist ein Standardverfahren
Häufig - gerade in der Soziologie - ist man an Rückwärtsmodellen interessiert, d.h. die Invertierung der aus empirischen Daten algorithmisch gelernten Modelle
Die Inversion ist schwierig durch Mehrdeutigkeit der Abbildung
Variablenintervalle und Wertdiskretisierung können das Inversionsproblem auf Randbedingsungslösen reduzieren und lösbar machen
Inversion von ANN benötigt eine übgeordnete bidirektionale und umschaltbare Netzwerkstruktur