In der Mess- und Prüftechnik
PD Stefan Bosse
Universität Bremen - FB Mathematik und Informatik
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick ::
Anwendungsklassen von Maschinellen Lernen
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Motivation
Dieser Kurs mit interaktiven Übungen soll:
Einen anwendungsorientierten Einstieg in die Datenanalyse und Interpretation mit Verfahren des Maschinellen Lernens bieten;
Einen Überblick über gängige und weniger gängige Verfahren geben;
Interaktive Tutorials und Übungen mit zielgruppenorientierten Fallbeispielen sollen Verfahren begreifbar und erfahrbar machen!
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Inhalte
Die Ontologie des Kurses besteht aus den Bausteinklassen:
Weiterhin aus den Anwendungs- und Datenklassen:
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Inhalte
Die Grenzen der Datenklassen sind fließend! Material, Maschine und Mensch als Sensoren!
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Inhalte
Gemeinsame Verfahren und Modelle → Unterschiedliche Daten, Aussagen, Anwendungen
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Organisation der Veranstaltung
Vorlesungen mit integrierten Übungen
Asynchrone Videos und Tutorials
Gemeinsame Treffen mit Videokonferenz (Zoom, falls erforderlich)
Interaktive Tutorials und Übungen mit NoteBook und WorkBook (NoteBook-2) im Web Browser!
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Organisation der Veranstaltung
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Services
Web Service: Informationen, Dokumente, Folien, Videos:
https://edu-9.de/Lehre/ml3k
Dokuwiki: News, Informationen und Links, Chats, Videostreams:
https://ag-0.de/dokuwiki
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Prüfungsleistungen
Eine mündliche Abschlussprüfung (20 Minuten); oder alternativ 2.
Eine schriftliche Seminararbeit (Experimentelle Arbeit oder Literaturrecherche)
Bearbeitung und Abgabe der digitalen Übungen (JSON Dateien)
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Literatur
S. Richter, Statistisches und maschinelles Lernen. Springer Spektrum, 2019.
E. Alpaydın, Introduction to Machine Learning. MIT Press, 2010.
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Literatur
Axel Rauschmayer, JavaScript For Impatient Programmers.
M. Haverbeke, Eloquent JavaScript. 2018.
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Literatur
J. Bell, Machine Learning - Hands-On for Developers and Technical Professionals. John Wiley & Sons, Ltd, 2015.
P. Attewell and D. B. Monaghan, Data mining for the social sciences : an introduction. University of California Press, 2015.
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Software
Interaktive vorwiegend praktische Übungen werden rein digital im Web Browser mit den NoteBooks durchgeführt
Ein digitale Übung (oder Turorial) besteht aus:
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Software
Ein NoteBook im WEB Browser
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Software
Top-down Bearbeitungsfluss
Statische Struktur mit dynamischen Inhalten
Alle dynamischen Inhalte können in einer JSON Datei gespeichert und wieder geladen werden
Es können Notizzettel überall im NoteBook angeheftet werden (werden auch gespeichert)
Musterlösungen (dynamische Inhalte) können eingebettet und mit einem Schlüssel freigeschaltet werden
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: WorkBook
Dynamische Struktur mit dynamischen Inhalten
Ein WorkBook besteht aus
Programmierung in JavaScript, aber menügesteuerte und geführte Auswahl von Ausführungsblöcken mit einer kursspezigischen Bibliothek
Alle dynamischen Inhalte und Daten können im JSON Format gespeichert und wieder geladen werden
Die NoteBook Konzepte (Editierbare Aufgaben und Einreichungs-/Hilfefunktion) sind jetzt auch hier integriert
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: WorkBook
Ein WorkBook Beispiel
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Machinelles Lernen
Welche Begriffe werden häufig bei ML genannt:
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Machinelles Lernen
Welche Anwendungsgebiete gibt es:
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Machinelles Lernen
Welche Fragestellungen (zu lösende Probleme) gibt es:
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Inhalte
Eingabe x: Daten (Attribute) und Eigenschaften (Analyse)
Sensoren: Erfassung von Daten, S(welt): welt → x
Ausgabe y: Numerische und kategorische Werte
Metriken und Taxonomie: Grundlagen des Maschinellen Lernens
Algorithmen und Modelle: f(x): x → y
Training, Lernen, Prädiktion, Test M(<x,y>): <x,y> → f
Anwendungen
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Geschichte
www.pinterest.com Die Geschichte fokussiert auf Neuronale Netze. Es gibt mehr.
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Modelle
Entscheidungsbäume (gerichtete Graphen)
Funktionen (z.B. Polynome)
Funktionsgraphen (z.B. künstliche neuronale Netzwerke)
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Algorithmen
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Datenanalyse und Eigenschaftsselektion
Wir unterscheiden folgende Klassen von Eigenschaften in der Datenanalyse und Prädiktion (Merkmale, Features):
Eigenschaften der Eingabedaten, vor allem dominante Eigenschaften abgeleitet aus den Eingabedaten x mit starker y Korrelation
Zieleigenschaften, also Werte der Zielvariable y
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Datenanalyse und Eigenschaftsselektion
Häufig sind die rohen sensorischen Daten(variablen) zu hochdimensional und noch abhängig voneinander (schwache Korrelation mit y)
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Datenanalyse und Eigenschaftsselektion
Häufig sind die rohen sensorischen Daten(variablen) zu hochdimensional und noch abhängig voneinander (schwache Korrelation mit y)
Reduktion auf wesentliche Merkmale kann ML Qualität deutlich verbessern!
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Datenanalyse und Eigenschaftsselektion
Häufig sind die rohen sensorischen Daten(variablen) zu hochdimensional und noch abhängig voneinander (schwache Korrelation mit y)
Reduktion auf wesentliche Merkmale kann ML Qualität deutlich verbessern!
Häufig besitzen einzelne Sensorvariablen keine oder nur geringe Aussagekraft (geringe Entscheidbarkeitsqualität) → geringe bis keine Korrelation mit y oder sogar Antikorrelation (Störung)
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Datenverarbeitung
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Datenverarbeitung
6 Maschinelles Lernen ist ein Werkzeug der Datenanalyse und des Data Minings
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Modellbildung
100 Kausale vs. Prädiktive Modellbildung und Physikalische Modelle versa algorithmisch bestimmte Modelle (Hypothesen)
PD Stefan Bosse - Maschinelles Lernen und Datenanalyse - Modul 0 Überblick :: Induktion und Deduktion
6 Ablauf Überwachtes Lernen mit Trainings- (Induktion) und Applikationsphasen (Deduktion). Aber: Meistens keine Verallgemeinerung!