PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul F: Schnittstellen, Konfiguration, Fehleranaylse, Frameworks

Maschinelles Lernen und Datenanalyse

In der Mess- und Prüftechnik

In der Soziologie

PD Stefan Bosse

Universität Bremen - FB Mathematik und Informatik

1 / 40

PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul F: Schnittstellen, Konfiguration, Fehleranaylse, Frameworks

Ein- und Ausgabeschnittstellen von Prädiktorfunktionen

Kodierung und Dekodierung von Variablen für kont. Prädiktorfunktionen

Normalisierung und Skalierung von Daten

2 / 40

PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul F: Schnittstellen, Konfiguration, Fehleranaylse, Frameworks

Kagetorische Variablen

  • Kategorische Variablen müssen für die Verwendung in Prädiktorfunktionen in numerische Werte kodiert werden
    • Multi-level Kodierung: Abbildung von allen kategorischen Werten auf unterschiedlich numerische Werte (skalare und vektorielle Werte)
    • One-hot Kodierung: Abbildung von allen kategorischen Werten auf 01 Vektoren

Aber: Anders als die Intervallkodierung von numerischen Variablen (z.B. für Entsch.bäume) muss im umgekehrten Fall der Kodierung einer kat. Variable in eine numerische Variable eine Intervall- und Verhältnisskalierung existieren!!

3 / 40

PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul F: Schnittstellen, Konfiguration, Fehleranaylse, Frameworks

Beispiele

  • Farben C={rot,grün,blau,braun}
    • Kodierung in skalaren kont. Variable aber mit diskreten Werten
    • Kodierung in vektorielle Variable mit kont. Werten → RGB

z1(C)=⎪ ⎪ ⎪ ⎪⎪ ⎪ ⎪ ⎪1,C=rot2,C=gruen3,C=blau4,C=braun,z2(C)=⎪ ⎪ ⎪ ⎪⎪ ⎪ ⎪ ⎪(1.0,0.0,0.0),C=rot(0.0,1.0,0.0),C=gruen(0.0,0.0,1.0),C=blau(0.5,0.0,0.5),C=braun

4 / 40

PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul F: Schnittstellen, Konfiguration, Fehleranaylse, Frameworks

Welche Probleme ergeben sich bei der Multi-level Kodierung (skalar) von Zielvariablen bei typischen Sigmoid Transferfunktionen von Neuronen?

  • Nichtlineare Funktion×
  • Sättigung an den Grenzen×
  • No search results.
5 / 40

PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul F: Schnittstellen, Konfiguration, Fehleranaylse, Frameworks

Nichtlinearität an den Rändern [0,1]

6 / 40

PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul F: Schnittstellen, Konfiguration, Fehleranaylse, Frameworks

Ein- und Ausgabeschnittstellen