From 52a5cbc553e8facbed761716d5fa0abba93d6cb6 Mon Sep 17 00:00:00 2001 From: Manuel Thalmann Date: Thu, 19 Jan 2023 20:56:01 +0100 Subject: [PATCH] Add draft of STS summary --- .../STS - Stochastik und Statistik/Summary.md | 95 +++++++++++++++++++ 1 file changed, 95 insertions(+) diff --git a/Notes/Semester 3/STS - Stochastik und Statistik/Summary.md b/Notes/Semester 3/STS - Stochastik und Statistik/Summary.md index c6d8b2a..9c92f46 100644 --- a/Notes/Semester 3/STS - Stochastik und Statistik/Summary.md +++ b/Notes/Semester 3/STS - Stochastik und Statistik/Summary.md @@ -1 +1,96 @@ # Stochastik und Statistik + +- [Stochastik und Statistik](#stochastik-und-statistik) + - [Deskriptive Statistik](#deskriptive-statistik) + - [Merkmals-Typen](#merkmals-typen) + - [Häufigkeiten](#häufigkeiten) +- [Glossar](#glossar) + +## Deskriptive Statistik +Ermittlung von Kenngrössen und Datenvalidierung + +### Merkmals-Typen +```mermaid +flowchart TD + r[Merkmals-Typ] + q[Qualitativ/Kategoriell] + m[Quantitativ/Metrisch] + n[Nominal] + o[Ordinal] + d[Diskret] + s[Stetig] + r --> q + r --> m + q --> n + q --> o + m --> d + m --> s +``` + + - Qualitativ/Kategoriell - Unmessbar + - Nominal: Nicht mit bestimmtem Wert verbunden + - Ordinal: Mit Wert verbunden + - Quantitativ/Metrisch - Messbar + - Diskret: Nur bestimmte Werte möglich + - Stetig: Jegliche Werte möglich + +***Beispiele:*** + +Frage: Welche Sprache sprichst du? + +| Ausprägungen | Merkmal-Typ | +| ------------------------------------------------ | ----------- | +| Deutsch, Französisch, Italienisch, Rätoromanisch | Nominal | + +Frage: Ich würde das Produkt weiterempfehlen + +| Ausprägungen | Merkmal-Typ | +| ------------------------------------------------------------------------------ | ----------- | +| Stimme nicht zu, Stimme eher nicht zu, Keine Angabe, Stimme eher zu, Stimme zu | Ordinal | + +Frage: Wieviele Male hast du heute Steam gestartet? + +| Ausprägungen | Merkmal-Typ | Bemerkung | +| ------------------ | ----------- | --------------------------------------------------- | +| Ganze Zahlen $> 0$ | Diskret | Es sind keine beliebigen Werte möglich (bspw. 0.5). | + +Frage: Was ist dein Welt-Rekord im 100-Meter-Lauf? + +| Ausprägungen | Merkmal-Typ | Bemerkung | +| -------------- | ----------- | ---------------------------------------------------------------- | +| Beliebige Zeit | Stetig | Jegliche Zahlen (mit beliebig vielen Kommastellen) sind möglich. | + +Frage: Wieviel kostet ein Mars-Riegel? + +| Ausprägungen | Merkmal-Typ | Bemerkung | +| ----------------------- | ----------- | ------------------------------------------------------------------- | +| Beliebiger Preis in CHF | Diskret | Beträge, die nicht durch 5 Rappen teilbar sind, sind nicht möglich. | + +## Häufigkeiten +Eine Häufigkeit ist die Anzahl Male, die ein Merkmalsträger in der Stichprobe eine bestimmte Eigenschaft erfüllt. +Diese kann auf verschiedene Weisen dargestellt werden. + + - ***Absolute Häufigkeit $h_i$:*** Die absolute Häufigkeit ist die Anzahl der gezählten Elemente. + - ***Relative Häufigkeit $f_i$:*** Ergibt sich, indem man die absolute Häufigkeit durch den Stichproben-Umfang teilt. + $$f_i = \frac{h_i}{n}$$ + +Zudem gelten folgende Regeln: + +$$\sum_{i = 1}^n h_i = n$$ +$$\sum_{i = 1}^n f_i = 1$$ + +Die Funktion für die Häufigkeitsfunktion (auch genannt: Dichtefunktion) hat folgende Abkürzungen: + + - Für diskrete Merkmale: _PMF_ (probability mass function) + - Für stetige Merkmale: _PDF_ (probability density function) + +
+ + - $f_i$: Relative Häufigkeit + - $h_i$: Absolute Häufigkeit + - $n$: Anzahl Merkmalträger in der Stichprobe + +
+ +# Glossar + - Univariate Daten: Daten, welche nur ein Merkmal haben