Übung 3.4 zu Einführung in Maschinelles Lernen (PD Stefan Bosse)

Klassifikation mit Entscheidungsbäumen und C4.5 Algorithmen

Klassifikation mit Entscheidungsbäumen und C4.5 Algorithmen
Daten
Numerische Daten
Energy efficiency Data Set
Ein einfacher Klassifikator
Vorbermerkung
Ein C4.5 Klassifikator
Aufgaben

Daten

Numerische Daten

Energy efficiency Data Set

DATA: Variable State.dataEE01 Type: {X1, X2, X3, X4, X5, X6, X7, X8, Y1, Y2} []

X1 Relative Compactness
X2 Surface Area
X3 Wall Area
X4 Roof Area
X5 Overall Height
X6 Orientation
X7 Glazing Area
X8 Glazing Area Distribution
y1 Heating Load
y2 Cooling Load
X,Y=Klasse={N,P}

 ▸ 
 ✗ 
 ≡ 

Ein einfacher Klassifikator

Vorbermerkung

Ein C4.5 Klassifikator

Nachfolgend wird gezeigt wie auf einfachen kategorischen Daten ein einfacher Klassifikator algorithmisch durch Tarining erzeugt werden kann.

Beispiel Datentabelle

 ▸ 
 ✗ 
 ≡ 

Beispiel Klassifikator C45 mit Training

 ▸ 
 ✗ 
 ≡ 

Test Klassifikator C45

 ▸ 
 ✗ 
 ≡ 

ID3 Modell: Die Baumstruktur

 ▸ 
 ✗ 

Aufgaben

Die Daten

 ▸ 
 ✗ 
 ≡ 

Aufgabe.

Benutze D=this.data.

  1. Die Zielvariablen müssen intervallkodiert werden! Empfehlung: 4-5 Intervalle (Klassen A-E, wie bei dem Energielabeling von Geräten). Die kodierten Variablen Y1 und Y2 als Y1K und Y2K in die Tabelle einfügen (Achtung: Datenstrukturtabelle!).
  2. Teile den Datensatz in Trainings- und Testdaten. Wähle eine geeignete Verteilung. Wiedehole die Parititionierung ggfs. wenn 2./3./4. keine guten Ergebnisse liefern.
  3. Mit dem C45 Algorithmus soll ein Modell trainiert werde. Bestimme die Trainingszeit (mit der time() Funktion, gibt Zeit in ms zurück).
  4. Test Ergebnisse und bestimmte die Fehlerrate für die Trainings- und Testdaten
  5. Wähle geeignete Features (reduzierter Satz) aus um die bestmögliche Klassifikation zu erzielen (also Fehler Training und Test)

Intervallkodierung der Zielvariablen

 ▸ 
 ✗ 
 ≡ 

Datenteilung

 ▸ 
 ✗ 
 ≡ 

C45 Modell und Training

 ▸ 
 ✗ 
 ≡ 

C45 Test

 ▸ 
 ✗ 
 ≡ 

C4.5 Modell: Die Baumstruktur von this.modelX

 ▸ 
 ✗ 




Hilfe



Einreichung (Assignment #04-30445)



Prüfen



Bewerten (Lehrer)




Created by the NoteBook Compiler Ver. 1.8.11 (c) Dr. Stefan Bosse (Thu Jan 14 2021 16:15:32 GMT+0100 (CET))