Übung 4.4 zu Einführung in Maschinelles Lernen (PD Stefan Bosse)

Prädiktorfunktionen mit Neuronalen Netzen

Prädiktorfunktionen mit Neuronalen Netzen
Allgemeine Hinweise
Daten
Numerische Daten
Energy efficiency Data Set
Ein einfaches Netzwerk
Vorbermerkung
Eine KNN-basierte Prädiktorfunktion
Daten und Datenteilung
Die MLP Prädiktorfunktion
Test
Datennormalisierung
Das EXOR Beispiel
Daten
Modell
Training
Test
Aufgaben

Allgemeine Hinweise

this.data=[];
var self=this;
function foo( )  {
  self.push([1,2,3,4])
}

Daten

Numerische Daten

Energy efficiency Data Set

DATA: Variable State.dataEE01 Type: {X1, X2, X3, X4, X5, X6, X7, X8, Y1, Y2} []

X1 Relative Compactness
X2 Surface Area
X3 Wall Area
X4 Roof Area
X5 Overall Height
X6 Orientation
X7 Glazing Area
X8 Glazing Area Distribution
y1 Heating Load
y2 Cooling Load
X,Y=Klasse={N,P}
1
2
 
print(dataEE01);
Table(dataEE01);

 ▸ 
 ✗ 
 ≡ 

Ein einfaches Netzwerk

Vorbermerkung

Eine KNN-basierte Prädiktorfunktion

Nachfolgend wird gezeigt wie auf einfachen numerischen oder kategorischen Daten eine einfache Prädiktorfunktion algorithmisch durch Tarining erzeugt werden kann.

Daten und Datenteilung

Beispiel Datentabelle
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
 
var x = [[1,1,1,0,0,0],
         [1,0,1,0,0,0],
         [1,1,1,0,0,0],
         [0,0,1,1,1,0],
         [0,0,1,1,0,0],
         [1,0,1,0,0,0],
         [1,1,1,0,0,0],
         [0,0,1,1,1,0],
         [0,0,1,1,0,0],
         [0,0,1,1,1,0]];
var y = [[1, 0],
         [1, 0],
         [1, 0],
         [0, 1],
         [0, 1],
         [1, 0],
         [1, 0],
         [0, 1],
         [0, 1],
         [0, 1]];
this.data0 = x.merge(y,'c');
var parts = ML.split(this.data0,5,5);  // N ist hier zu klein; daher ist Aufteilung nicht sinnvoll!
// this.data0Train=parts[0]; this.data0Test=parts[0];
this.data0Train=this.data0; this.data0Test=this.data0;
Table(this.data0);

 ▸ 
 ✗ 
 ≡ 

Die MLP Prädiktorfunktion

Beispiel Erzeugung Prädiktorfunktion MLP
1
2
3
4
5
6
 
// Erzeugung des Modells
this.model0 = ML.learner({
  algorithm:ML.ML.MLP,
  layers: [6,4,4,5,2],
  verbose : 1,
});

 ▸ 
 ✗ 
 ≡ 

Anders als bei Entscheidungsbäumen können KNN mehrere Zielvariablen ausgeben!

Beispiel Training Prädiktorfunktion MLP
1
2
3
4
5
6
7
8
 
// Erzeugung des Modells
ML.log(print);
ML.train(this.model0,{
    data : this.data0,
    features : [0,1,2,3,4,5],
    target   : [6,7],
    epochs : 100,
});

 ▸ 
 ✗ 
 ≡ 

Test

Test Prädiktorfunktion MLP
1
2
3
4
5
6
7
8
9
10
11
 
var self=this;
var dataX0 = this.data0.sub([],[0,5]);
var dataY0 = this.data0.sub([],[6,7]);
var results = ML.predict(this.model0,dataX0);
var error=0; // quadr. Fehler
results.forEach(function (row,index) {
  error += Math.pow(row[0]-dataY0[index][0],2);
});
results=results.merge(dataY0,'c');
Table(results);
print(error)

 ▸ 
 ✗ 
 ≡ 

Test Prädiktorfunktion MLP
1
2
3
4
5
 
var self=this;
var dataX0 = this.data0.sub([],[0,5]);
var dataY0 = this.data0.sub([],[6,7]);
var results = ML.predict(this.model0,dataX0);
print(ML.statistics.crossEntropy(results,dataY0))

 ▸ 
 ✗ 
 ≡ 

Datennormalisierung

Datennormalisierung
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
 
var self=this;
this.data=dataEE01;
// Alle Attribute der Datentabelle inkl. Zielattr.
this.attributes = ML.statistics.features(this.data);
this.targets    = ['Y1','Y2'];
this.features   = this.attributes.without(this.targets);
print(this.features)
// Berechnung der Skalierungsdiskreptoren
this.scales     = this.attributes.map(function (attr) {
  return Math.scale0(self.data.pluck(attr),0,1);
});
this.scalesX    = this.scales.slice(0,this.features.length);
this.scalesY    = this.scales.slice(this.features.length);
// Transformation und Skalierung der Datentabelle
this.dataP = 
 ML.preprocess(this.data,'xmy',
    {features:this.features,target:this.targets,
     xscale:this.scalesX,
     yscale:this.scalesY})
Table(this.dataP.x);
Table(this.dataP.y);

 ▸ 
 ✗ 
 ≡ 

Frage. Warum ist die automatische Skalierung der Trainings- und Testdaten evtl. problematisch?

Datenexpansion
1
2
3
4
5
 
var self=this;
var yUnscaled = this.dataP.y.map(function (row) {
  return ML.unscale(row,self.scalesY);
});
Table(yUnscaled);

 ▸ 
 ✗ 
 ≡ 

Das EXOR Beispiel

Daten

EXOR Daten
1
2
3
4
5
6
7
8
9
10
11
12
13
 
var x = [
  [0,0],
  [0,1],
  [1,0],
  [1,1]
]
var y = [
  [0],
  [1],
  [1],
  [0]
]
this.dataEXOR={x:x,y:y}

 ▸ 
 ✗ 
 ≡ 

Modell

EXOR KNN Modell
1
2
3
4
5
6
 
this.modelEXOR=ML.learner({
  algorithm: ML.ML.MLP,
  layers : [2,4,1],
  verbose: 1,
});
ML.log(print);

 ▸ 
 ✗ 
 ≡ 

Training

EXOR KNN Modell Training
1
2
3
4
5
6
 
ML.train(this.modelEXOR,{
  x:this.dataEXOR.x,
  y:this.dataEXOR.y,
  epochs:1000
});
print(this.modelEXOR.time+' ms');

 ▸ 
 ✗ 
 ≡ 

Test

EXOR KNN Modell Test
1
2
3
 
var results=ML.predict(this.modelEXOR,this.dataEXOR.x);
print(results)
print(ML.statistics.crossEntropy(ML.math.vec2Mat(results),this.dataEXOR.y));

 ▸ 
 ✗ 
 ≡ 

Aufgaben

Punkte:1./22./23./24./2
Die Daten
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
 
var self=this;
this.data=dataEE01;
this.attributes = ML.statistics.features(this.data);
this.targets    = ['Y1','Y2'];
this.features   = this.attributes.without(this.targets);
print(this.features)
// Berechnung der Skalierungsdeskriptoren
this.scales     = this.attributes.map(function (attr) {
  return Math.scale0(self.data.pluck(attr),0,1);
});
this.scalesX    = this.scales.slice(0,this.features.length);
this.scalesY    = this.scales.slice(this.features.length);
// Transformation und Skalierung
this.dataP = 
 ML.preprocess(this.data,'xmy',
    {features:this.features,target:this.targets,
     xscale:this.scalesX,
     yscale:this.scalesY})

 ▸ 
 ✗ 
 ≡ 

Aufgabe.

Benutze D=this.data und führe bei Datenteilung wieder die Transformation und Skalierung durch (siehe oben).

Versuche zunächst ein Modell mit den zwei Zielvariablen Y1 und Y2. Wenn es keine gute Konvergenz beim Training gibt können auch zwei getrennte Modelle für Y1 und Y2 erzeugt und trainiert werden.

  1. Teile den Datensatz in Trainings- und Testdaten. Wähle eine geeignete Verteilung. Wiedehole die Parititionierung ggfs. wenn 2./3./4. keine guten Ergebnisse liefern.
  2. Erstelle das MLP Modell (this.model). Wähle mindestens drei Konfigurationen (Variation der inneren Schichten des ANN, auch ohne innere Schicht)
  3. Mit dem MLP Algorithmus soll ein Modell trainiert werde. Bestimme die Trainingszeit (model.time gibt die Trainingszeit des letzten Durchlaufs and), in Abähngigkeit der Epochen (Trainingsdurchläufe).
  4. Teste Ergebnisse und bestimme die Fehlerrate für die Trainings- und Testdaten

Datenteilung
1
2
3
4
 
var data   = this.data; // preprocess nach Teilung erforderlich!
// ML.split, siehe oben
this.test1  = ..;
this.train1 = ..; 

 ▸ 
 ✗ 
 ≡ 

Erstellung MLP Modell
1
2
3
 
this.model=ML.learner({
 // TODO, Vorschlag für Konf.: [8,4,2,2]
});

 ▸ 
 ✗ 
 ≡ 

MLP Modell und Training
1
2
3
 
ML.train(this.model,{
  // TODO
});

 ▸ 
 ✗ 
 ≡ 

MLP Test
1
 
// this.model, this.train1 und this.test1 verwenden, siehe oben

 ▸ 
 ✗ 
 ≡ 




Hilfe



Einreichung (Assignment #04-37754 )



Prüfen



Bewerten (Lehrer)




Created by the NoteBook Compiler Ver. 1.8.11 (c) Dr. Stefan Bosse (Thu Jan 14 2021 16:15:41 GMT+0100 (CET))