In der Mess- und Prüftechnik
PD Stefan Bosse
Universität Bremen - FB Mathematik und Informatik
Stefan Bosse - Maschinelles Lernen - Daten und Sensoren -
Metriken von Daten
Metriken von Aussagen
Sensoren als Datenquellen
Messverfahren und Sensorsysteme
Stefan Bosse - Maschinelles Lernen - Daten und Sensoren - Daten
Daten sind die Grundlage für die Modellbildung und Modelltestung
Daten können aus einer Vielzahl von Quellen stammen
Stefan Bosse - Maschinelles Lernen - Daten und Sensoren - Daten
Allgemein kann man Daten und deren Werte unterteilen in:
Daten haben daher eine Dimensionalität 𝕏N, wobei die Wertemenge 𝕏 einer Dimension aus den ganzen ℕ, reelen ℝ, der Zeit 𝕋 oder kategorischen Wertemengen 𝕊 bestehen kann (oder Untermengen davon).
Stefan Bosse - Maschinelles Lernen - Daten und Sensoren - Datenreduktion
P(XN):XN→YM|Y|<|X|,M<N
function isRaining(temp,sunrad,moisture) = temp < 0 ? → false temp > 40 ? → false (sunrad-moisture) > 30? → false true
Beispiel aus der Messtechnik mit einer Datenreduktionsfunktion ℝ3 → 𝔹
Stefan Bosse - Maschinelles Lernen - Daten und Sensoren - Datenreduktion
function isStrong(age,weight,length) = age < 10 ? → false weight > 200 ? → false (weight/length) > 30? → false true
Beispiel einer Datenreduktionsfunktion ℝ3 → 𝔹
Stefan Bosse - Maschinelles Lernen - Daten und Sensoren - Datenreduktion
Stefan Bosse - Maschinelles Lernen - Daten und Sensoren - Datenreduktion
Stefan Bosse - Maschinelles Lernen - Daten und Sensoren - Datenreduktion
Stefan Bosse - Maschinelles Lernen - Daten und Sensoren - Datenklassen (longitudinal)
Ein Sensorsignal ist zeitlich immer diskret, aber die physikalische Variable die der Sensor misst ist zeitlich kontinuierlich (Sampingtheorem beachten)
Stefan Bosse - Maschinelles Lernen - Daten und Sensoren - Daten
Stefan Bosse - Maschinelles Lernen - Daten und Sensoren - Daten
→X=(x1,x2,..,xd)
→dj=→xj=(xj,1,xj,2,..,xj,d)
// JavaScripttype row = { x1:number|string, x2:number|string, .., xd:number|string }type table = row array;
Stefan Bosse - Maschinelles Lernen - Daten und Sensoren - Eingabe- und Ausgabevariablen
Die Variablenmenge setzt sich aus Ein- und Ausgabevariablen zusammen
Sensoren sind typischerweise Eingabevariablen x
Aussagen sind Ausgabevariablen y, also Ergebnisse die sich aus den Eingangsvariablen ableiten lassen können (durch eine Funktion F):
→Xxy=(X1,X2,..,Xu,Y1,Y2,..,Yv)→X=(X1,X2,..,Xu)→Y=(Y1,Y2,..,Yv)→dj=(xj,1,xj,2,..,xj,u,yj,1,yj,2,..,yj,v)F(→X):→X→→Y,
mit u+v=d.
Stefan Bosse - Maschinelles Lernen - Daten und Sensoren - Merkmale und Eigenschaften (Features)
Wir unterscheiden zwei Arten von Merkmalen:
Stefan Bosse - Maschinelles Lernen - Daten und Sensoren - Merkmale und Eigenschaften (Features)
Die Merkmalsselektion ist also die Vorstufe und Datenvorverarbeitung, selten werd mit Rohdaten direkt gearbeitet
Es muss eine Merkmalsselektionsfunktion MF geben, die automatisch die Merkmale aus den den Daten ableitet:
M(→x):→x→→y⇒Fto⇔yMF(→x):→x→→FtiMt(→Fti):→Fti→→Fto
Stefan Bosse - Maschinelles Lernen - Daten und Sensoren - Beispiel einer Datenmatrix
1
Stefan Bosse - Maschinelles Lernen - Daten und Sensoren - Beispiel einer Datenmatrix
Berechnetes Dehnungs-Spannungsdiagramm
www.precifast.de/elastizitaetsmodul-e-modul
Messdaten aus Dehnversuch
Dehnung [mm] | Kraft [kN] |
---|---|
0 | 0 |
0.1 | 0.2 |
0.2 | 0.7 |
0.3 | 1.5 |
0.4 | 1.7 |
0.5 | 1.9 |
0.6 | 2.0 |
0.7 | 0.2 |
0.8 | -0.5 |
Stefan Bosse - Maschinelles Lernen - Daten und Sensoren - Beispiel einer Datenmatrix
Die gemessenen Variablen X1 bis X4 sind metrische Datenvariablen, die Variable X5=y ist eine kategorische Variable!
Die gemessenen Variablen X1 bis X4 (also Sensoren) nennt man Attribute, da sie Eigenschaften und beschreibende Variablen der Zielvariablen y sind
Stefan Bosse - Maschinelles Lernen - Daten und Sensoren - Sensoren
Welche Sensoren und Messdaten kennt ihr:
Stefan Bosse - Maschinelles Lernen - Daten und Sensoren - Sensoren
Messtechnik
Bei der Messung mit Sensoren unterscheidet man:
Stefan Bosse - Maschinelles Lernen - Daten und Sensoren - Sensoren
Soziotechnische Systeme, Umfragen
Allgemein verfügbare Daten
Stefan Bosse - Maschinelles Lernen - Daten und Sensoren - Sensormodell
Ein Sensor ist ein Messwandler, auch in der Soziologie (Indikator für eine Eigenschaft die nicht direkt messbar ist)
Ein Sensor bildet daher eine i.A. physikalische Größe x auf eine andere Größe y ab:
S(x):x→y,K:correct(x→y)
Es gibt i.A. eine Kalibrierungsfunktion K(f,x,y)
Beispiele:
Stefan Bosse - Maschinelles Lernen - Daten und Sensoren - Sensordaten
Sensoren S sind Datenquellen d von physikalischen, soziologischen oder sonstigen natürlichen nicht direkt erfassbaren Größen x
Die Datenwerte (numerisch) werden in einem definierbaren Intervall liegen
S(x):x→dd∈[a,b]⇒{v0,v1,..,vi}
Stefan Bosse - Maschinelles Lernen - Mess- und Sensorische Systeme - Sensordaten
Der Ursprung der Daten für Analyse und Maschinelles Lernen!
Ein Sensor kommt selten allein.
Stefan Bosse - Maschinelles Lernen - Mess- und Sensorische Systeme - Messverfahren
Man unterscheidet zwei verschiedene Messverfahren:
Stefan Bosse - Maschinelles Lernen - Mess- und Sensorische Systeme - Sensoraggregation
Stefan Bosse - Maschinelles Lernen - Mess- und Sensorische Systeme - Sensoraggregation
In sensorischen Systemen werden Sensordaten in verschiedenen Ebenen verarbeitet:
Vertikale Ebenen repräsentieren die sensorischen Domainen und die Sensorklassen;
Horizontale Ebenen repräsentieren die Datenverarbeitung.
Stefan Bosse - Maschinelles Lernen - Mess- und Sensorische Systeme - Sensoraggregation
Stefan Bosse - Maschinelles Lernen - Mess- und Sensorische Systeme - Sensoraggregation
Stefan Bosse - Maschinelles Lernen - Mess- und Sensorische Systeme - Sensoraggregation
Grundlegender Zusammenhang der horizontalen und vertikalen Ebenen in Sensorischen Systemen
Stefan Bosse - Maschinelles Lernen - Mess- und Sensorische Systeme - Sensoraggregation
Räumliche Abbildung der vertikalen Ebenen auf Cloud Computing
Stefan Bosse - Maschinelles Lernen - Mess- und Sensorische Systeme - Sensoren in den Ebenen
Stefan Bosse - Maschinelles Lernen - Mess- und Sensorische Systeme - Umfragen und Crowd Sensing
8
Von klassischen Umfragen zu mobilen Crowd Sensing mit Smartphones
Stefan Bosse - Maschinelles Lernen - Mess- und Sensorische Systeme - Messfehler und Vertrauen
Die Messgrößen können statisch (zeitlich konstant) oder dynamisch (zeitlich veränderlich) sein. Die Wandlung dieser Messgrößen ergeben dann entsprechend Gleich- und Wechselsignale.
Auch eine prinzipiell zeitlich unveränderliche Messgröße (bezogen auf die Messung in einem vorgegeben Zeitinterval τ) erzeugt kein konstantes Signal. Ursache: Rauschen
Wiederholt man daher eine Messung N-mal unter gleichen Bedingungen, so wird man eine Reihe von verschiedenen Messwerten {s1,s2,...,sn} erhalten.
Es gibt systematische und zufällige Fehler bei der Messung, die sich überlagern.
Stefan Bosse - Maschinelles Lernen - Mess- und Sensorische Systeme - Messfehler und Vertrauen
Stefan Bosse - Maschinelles Lernen - Mess- und Sensorische Systeme - Messfehler und Vertrauen
9
Offset und Präzision bei der Messung einer Variable X
Stefan Bosse - Maschinelles Lernen - Mess- und Sensorische Systeme - Messfehler und Vertrauen
K(X,Y,Z) : X×Y×Z→S,K(x,y,z)≈m∑n=0anxn+m∑n=0bnyn+m∑n=0cnzn
So kann z.B. bei einer Messung einer Kraft oder einer Dehnung die umgebende Temperatur T oder Strukturschwingungen Einfluss auf den Sensor und dessen Übertragungsfunktion und somit auf das Messsignal S haben.
Stefan Bosse - Maschinelles Lernen - Mess- und Sensorische Systeme - Messfehler und Vertrauen
So kann z.B. bei einer Messung von sozialpsychologischen Parametern der Wohnort und die Lebensumgebung Einfluss auf den Sensor und dessen "Übertragungsfunktion" und somit auf das "Messsignal" S haben.
Stefan Bosse - Maschinelles Lernen - Mess- und Sensorische Systeme - Messfehler und Vertrauen
9
Stefan Bosse - Maschinelles Lernen - Mess- und Sensorische Systeme - Messfehler und Vertrauen
Zufällige Fehler beeinflussen die Genauigkeit einer Messung (Rauschen).
Rauschen beeinflußt die Berechung von Eingabedaten- und Zieleigenschaften (ML Ausgabe)!
Wiederholt man eine Messung einer Größe X die durch reine zufälligen Fehler verfälscht wird, so ist die Häufigkeitsverteilung der Messwerte S={s1,s2,...,sn} um einen Mittelwert ¯S durch eine Gaussverteilung gegeben (dabei muss die Anzahl der Messungen N groß sein).
Stefan Bosse - Maschinelles Lernen - Mess- und Sensorische Systeme - Messfehler und Vertrauen
9
Häufigkeitsverteilung nach Gauss von Messwerten um einen Mittelwert
Stefan Bosse - Maschinelles Lernen - Mess- und Sensorische Systeme - Messfehler und Vertrauen
¯S = 1N N∑i=1si
σ = ⎷1N−1 N∑i=1(si−¯S)2
Stefan Bosse - Maschinelles Lernen - Mess- und Sensorische Systeme - Messfehler und Vertrauen
Eine Vergrößerung der Anzahl N der Messungen (unter gleichen Bedingungen!) führt zu einer Verbesserung des Mittelwertes ¯S (Grenzfall N → ∞), nicht aber zu einer wesentlichen Verkleinerung der Standardabweichung σ, da die Genauigkeit nicht steigt!
Stefan Bosse - Maschinelles Lernen - Mess- und Sensorische Systeme - Messfehler und Vertrauen
Σ ∈ [¯S-σ,¯S+σ] mit 68.3%
Σ ∈ [¯S-2σ,¯S+2σ] mit 95.4%
Σ ∈ [¯S-3σ,¯S+3σ] mit 99.73%
Stefan Bosse - Maschinelles Lernen - Mess- und Sensorische Systeme - Messfehler und Vertrauen
Rauschquellen bei einer Messung
Stefan Bosse - Maschinelles Lernen - Mess- und Sensorische Systeme - Beispiele: Statistische Analyse
Stefan Bosse - Maschinelles Lernen - Mess- und Sensorische Systeme - Zusammenfassung
Daten können klassifiziert werden in:
Alle Sensorvariablen unterliegen Messfehlern:
Eine (statistische) Datenanalyse ist häufig erster Schritt im ML Workflow