In der Werkstoff- und Prüftechnik
PD Stefan Bosse
Universität Bremen - FB Mathematik und Informatik / AG 0
Universität Siegen - FB Maschinenbau / LMW
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren ::
Metriken von Daten
Metriken von Aussagen
Sensoren als Datenquellen
Messverfahren und Sensorsysteme
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Daten
Daten sind die Grundlage für die Modellbildung und Modelltestung
Daten können aus einer Vielzahl von Quellen stammen
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Daten
Allgemein kann man Daten und deren Werte unterteilen in:
Daten haben daher eine Dimensionalität 𝕏N, wobei die Wertemenge 𝕏 einer Dimension aus den ganzen ℕ, reelen ℝ, der Zeit 𝕋 oder kategorischen Wertemengen 𝕊 bestehen kann (oder Untermengen davon).
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenreduktion
P(XN):XN→YM|Y|<|X|,M<N
isRaining <- function (temp,sunrad,moisture) { x = TRUE x[temp < 0] = FALSE x[temp > 40] = FALSE x[(sunrad-moisture) > 30] = FALSE x}
Beispiel aus der Messtechnik mit einer Datenreduktionsfunktion ℝ3 → 𝔹
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenreduktion
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenreduktion
Boolean: TRUE FALSENumerisch: 0 1 1.23 1.2e-3 -5 1LKategorisch: "A" "klein" "gross"Klassen: colors <- list("red"=1,"green"=2,"blue"=3)
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenreduktion
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenklassen in R
https://www.javatpoint.com/r-data-types Kerndatentypen in R
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenklassen in R
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenklassen in R
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenklassen (longitudinal)
Ein Sensorsignal ist zeitlich immer diskret, aber die physikalische Variable die der Sensor misst ist zeitlich kontinuierlich (Sampingtheorem beachten)
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenklassen (longitudinal)
http://venus.ifca.unican.es/Rintro/dataStruct.html Strukturierung von Daten in Vektoren, Listen, Matrizen und Arrays (Tensoren)
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenklassen (longitudinal)
Vektoren: eindimensionale Arrays, die zum Speichern von Sammlungsdaten desselben Modus verwendet werden
Matrizen: zweidimensionale Arrays zum Speichern von Datensammlungen desselben Modus. Auf sie wird über zwei ganzzahlige Indizes zugegriffen.
Arrays: ähnlich wie Matrizen, aber sie können mehrdimensional sein (mehr als zwei Dimensionen)
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenklassen (longitudinal)
Faktoren: Vektoren kategorialer Variablen, die die Komponenten eines anderen Vektors gleicher Größe gruppieren sollen
Listen: geordnete Sammlung von Objekten, wobei die Elemente unterschiedlichen Typs sein können
Datenrahmen: Verallgemeinerung von Matrizen, in denen verschiedene Spalten unterschiedliche Modusdaten speichern können.
Funktionen: Objekte, die vom Benutzer erstellt und für Berechnungen wiederverwendet werden.
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenklassen (longitudinal)
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenklassen (longitudinal)
→X=(x1,x2,..,xd)
→dj=→xj=(xj,1,xj,2,..,xj,d)
D <- matrix(0,nrow=10,ncol=3)colnames(D) <- c("x1","x2","y")
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenklassen (longitudinal)
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenklassen (longitudinal)
emp.data <- data.frame( emp_id = c (1:5), emp_name = c("Rick","Dan","Michelle", "Ryan","Gary"), salary = c(623.3,515.2,611.0,729.0,843.25), start_date = as.Date(c("2012-01-01", "2013-09-23", "2014-11-15", "2014-05-11", "2015-03-27")), stringsAsFactors = FALSE)
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Datenklassen (longitudinal)
print(emp.data) emp_id emp_name salary start_date1 1 Rick 623.30 2012-01-012 2 Dan 515.20 2013-09-233 3 Michelle 611.00 2014-11-154 4 Ryan 729.00 2014-05-115 5 Gary 843.25 2015-03-27
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Eingabe- und Ausgabevariablen
Die Variablenmenge setzt sich aus Ein- und Ausgabevariablen zusammen
Sensoren sind typischerweise Eingabevariablen x
Aussagen sind Ausgabevariablen y, also Ergebnisse die sich aus den Eingangsvariablen ableiten lassen können (durch eine Funktion F):
→Xxy=(X1,X2,..,Xu,Y1,Y2,..,Yv)→X=(X1,X2,..,Xu)→Y=(Y1,Y2,..,Yv)→dj=(xj,1,xj,2,..,xj,u,yj,1,yj,2,..,yj,v)F(→X):→X→→Y,
mit u+v=d.
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Merkmale und Eigenschaften (Features)
Wir unterscheiden zwei Arten von Merkmalen:
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Merkmale und Eigenschaften (Features)
Die Merkmalsselektion ist also die Vorstufe und Datenvorverarbeitung, selten werd mit Rohdaten direkt gearbeitet
Es muss eine Merkmalsselektionsfunktion MF geben, die automatisch die Merkmale aus den den Daten ableitet:
M(→x):→x→→y⇒Fto⇔yMF(→x):→x→→FtiMt(→Fti):→Fti→→Fto
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Beispiel einer Datenmatrix
M. J. Zaki and W. Meira, Data Mining and Machine Learning - Fundamental Concepts and Algorithms,2020
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Beispiel einer Datenmatrix
Berechnetes Dehnungs-Spannungsdiagramm
www.precifast.de/elastizitaetsmodul-e-modul
Messdaten aus Dehnversuch
Dehnung [mm] | Kraft [kN] |
---|---|
0 | 0 |
0.1 | 0.2 |
0.2 | 0.7 |
0.3 | 1.5 |
0.4 | 1.7 |
0.5 | 1.9 |
0.6 | 2.0 |
0.7 | 0.2 |
0.8 | -0.5 |
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Beispiel einer Datenmatrix
Quality Magazin, 2017 Dehnungsversuch mit Dehnungs-Kraft Diagramm
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Beispiel einer Datenmatrix
Die gemessenen Variablen X1 bis X4 sind metrische Datenvariablen, die Variable X5=y ist eine kategorische Variable!
Die gemessenen Variablen X1 bis X4 (also Sensoren) nennt man Attribute, da sie Eigenschaften und beschreibende Variablen der Zielvariablen y sind
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Sensoren
Welche Sensoren und Messdaten kennt ihr:
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Sensoren
Messtechnik
Bei der Messung mit Sensoren unterscheidet man:
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Sensoren
Soziotechnische Systeme, Umfragen
Allgemein verfügbare Daten
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Sensoren
R. Jha and S. V. Barai,Neural Networks and Genetic Algorithms in Struc-tural Health Monitoring, 2016 Zeitaufgelöste Ultraschallsignale (geführte Wellen) in der Schadensdiagnostik
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Sensormodell
Ein Sensor ist ein Messwandler, auch in der Soziologie (Indikator für eine Eigenschaft die nicht direkt messbar ist)
Ein Sensor bildet daher eine i.A. physikalische Größe x auf eine andere Größe y ab:
S(x):x→y,K:correct(x→y)
Es gibt i.A. eine Kalibrierungsfunktion K(f,x,y)
Beispiele:
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Daten und Sensoren :: Sensordaten
Sensoren S sind Datenquellen d von physikalischen, soziologischen oder sonstigen natürlichen nicht direkt erfassbaren Größen x
Die Datenwerte (numerisch) werden in einem definierbaren Intervall liegen
S(x):x→dd∈[a,b]⇒{v0,v1,..,vi}
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Sensordaten
Der Ursprung der Daten für Analyse und Maschinelles Lernen!
Ein Sensor kommt selten allein.
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messverfahren
Man unterscheidet zwei verschiedene Messverfahren:
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Sensoraggregation
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Sensoraggregation
In sensorischen Systemen werden Sensordaten in verschiedenen Ebenen verarbeitet:
Vertikale Ebenen repräsentieren die sensorischen Domainen und die Sensorklassen;
Horizontale Ebenen repräsentieren die Datenverarbeitung.
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Sensoraggregation
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Sensoraggregation
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Sensoraggregation
Grundlegender Zusammenhang der horizontalen und vertikalen Ebenen in Sensorischen Systemen
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Sensoraggregation
Räumliche Abbildung der vertikalen Ebenen auf Cloud Computing
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Sensoren in den Ebenen
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messfehler und Vertrauen
Die Messgrößen können statisch (zeitlich konstant) oder dynamisch (zeitlich veränderlich) sein. Die Wandlung dieser Messgrößen ergeben dann entsprechend Gleich- und Wechselsignale.
Auch eine prinzipiell zeitlich unveränderliche Messgröße (bezogen auf die Messung in einem vorgegeben Zeitinterval τ) erzeugt kein konstantes Signal. Ursache: Rauschen
Wiederholt man daher eine Messung N-mal unter gleichen Bedingungen, so wird man eine Reihe von verschiedenen Messwerten {s1,s2,...,sn} erhalten.
Es gibt systematische und zufällige Fehler bei der Messung, die sich überlagern.
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messfehler und Vertrauen
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messfehler und Vertrauen
J. G. Webster, Measurement, Instrumentation and Sensors Handbook, 1999
Offset und Präzision bei der Messung einer Variable X
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messfehler und Vertrauen
K(X,Y,Z) : X×Y×Z→S,K(x,y,z)≈m∑n=0anxn+m∑n=0bnyn+m∑n=0cnzn
So kann z.B. bei einer Messung einer Kraft oder einer Dehnung die umgebende Temperatur T oder Strukturschwingungen Einfluss auf den Sensor und dessen Übertragungsfunktion und somit auf das Messsignal S haben.
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messfehler und Vertrauen
So kann z.B. bei einer Messung von sozialpsychologischen Parametern der Wohnort und die Lebensumgebung Einfluss auf den Sensor und dessen "Übertragungsfunktion" und somit auf das "Messsignal" S haben.
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messfehler und Vertrauen
J. G. Webster, Measurement, Instrumentation and Sensors Handbook, 1999
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messfehler und Vertrauen
Zufällige Fehler beeinflussen die Genauigkeit einer Messung (Rauschen).
Rauschen beeinflußt die Berechung von Eingabedaten- und Zieleigenschaften (ML Ausgabe)!
Wiederholt man eine Messung einer Größe X die durch reine zufälligen Fehler verfälscht wird, so ist die Häufigkeitsverteilung der Messwerte S={s1,s2,...,sn} um einen Mittelwert ¯S durch eine Gaussverteilung gegeben (dabei muss die Anzahl der Messungen N groß sein).
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messfehler und Vertrauen
J. G. Webster, Measurement, Instrumentation and Sensors Handbook, 1999
Häufigkeitsverteilung nach Gauss von Messwerten um einen Mittelwert
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messfehler und Vertrauen
¯S = 1N N∑i=1si
σ = ⎷1N−1 N∑i=1(si−¯S)2
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messfehler und Vertrauen
Eine Vergrößerung der Anzahl N der Messungen (unter gleichen Bedingungen!) führt zu einer Verbesserung des Mittelwertes ¯S (Grenzfall N → ∞), nicht aber zu einer wesentlichen Verkleinerung der Standardabweichung σ, da die Genauigkeit nicht steigt!
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messfehler und Vertrauen
Σ ∈ [¯S-σ,¯S+σ] mit 68.3%
Σ ∈ [¯S-2σ,¯S+2σ] mit 95.4%
Σ ∈ [¯S-3σ,¯S+3σ] mit 99.73%
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Messfehler und Vertrauen
Rauschquellen bei einer Messung
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Beispiele: Statistische Analyse
PD Stefan Bosse - Automatische Schadensdiagnostik - Modul A Mess- und Sensorische Systeme :: Zusammenfassung
Daten können klassifiziert werden in:
Alle Sensorvariablen unterliegen Messfehlern:
Eine (statistische) Datenanalyse ist häufig erster Schritt im ML Workflow