Add draft of STS summary

This commit is contained in:
Manuel Thalmann 2023-01-19 20:56:01 +01:00
parent f1cec8e8bd
commit 52a5cbc553

View file

@ -1 +1,96 @@
# Stochastik und Statistik
- [Stochastik und Statistik](#stochastik-und-statistik)
- [Deskriptive Statistik](#deskriptive-statistik)
- [Merkmals-Typen](#merkmals-typen)
- [Häufigkeiten](#häufigkeiten)
- [Glossar](#glossar)
## Deskriptive Statistik
Ermittlung von Kenngrössen und Datenvalidierung
### Merkmals-Typen
```mermaid
flowchart TD
r[Merkmals-Typ]
q[Qualitativ/Kategoriell]
m[Quantitativ/Metrisch]
n[Nominal]
o[Ordinal]
d[Diskret]
s[Stetig]
r --> q
r --> m
q --> n
q --> o
m --> d
m --> s
```
- Qualitativ/Kategoriell - Unmessbar
- Nominal: Nicht mit bestimmtem Wert verbunden
- Ordinal: Mit Wert verbunden
- Quantitativ/Metrisch - Messbar
- Diskret: Nur bestimmte Werte möglich
- Stetig: Jegliche Werte möglich
***Beispiele:***
Frage: Welche Sprache sprichst du?
| Ausprägungen | Merkmal-Typ |
| ------------------------------------------------ | ----------- |
| Deutsch, Französisch, Italienisch, Rätoromanisch | Nominal |
Frage: Ich würde das Produkt weiterempfehlen
| Ausprägungen | Merkmal-Typ |
| ------------------------------------------------------------------------------ | ----------- |
| Stimme nicht zu, Stimme eher nicht zu, Keine Angabe, Stimme eher zu, Stimme zu | Ordinal |
Frage: Wieviele Male hast du heute Steam gestartet?
| Ausprägungen | Merkmal-Typ | Bemerkung |
| ------------------ | ----------- | --------------------------------------------------- |
| Ganze Zahlen $> 0$ | Diskret | Es sind keine beliebigen Werte möglich (bspw. 0.5). |
Frage: Was ist dein Welt-Rekord im 100-Meter-Lauf?
| Ausprägungen | Merkmal-Typ | Bemerkung |
| -------------- | ----------- | ---------------------------------------------------------------- |
| Beliebige Zeit | Stetig | Jegliche Zahlen (mit beliebig vielen Kommastellen) sind möglich. |
Frage: Wieviel kostet ein Mars-Riegel?
| Ausprägungen | Merkmal-Typ | Bemerkung |
| ----------------------- | ----------- | ------------------------------------------------------------------- |
| Beliebiger Preis in CHF | Diskret | Beträge, die nicht durch 5 Rappen teilbar sind, sind nicht möglich. |
## Häufigkeiten
Eine Häufigkeit ist die Anzahl Male, die ein Merkmalsträger in der Stichprobe eine bestimmte Eigenschaft erfüllt.
Diese kann auf verschiedene Weisen dargestellt werden.
- ***Absolute Häufigkeit $h_i$:*** Die absolute Häufigkeit ist die Anzahl der gezählten Elemente.
- ***Relative Häufigkeit $f_i$:*** Ergibt sich, indem man die absolute Häufigkeit durch den Stichproben-Umfang teilt.
$$f_i = \frac{h_i}{n}$$
Zudem gelten folgende Regeln:
$$\sum_{i = 1}^n h_i = n$$
$$\sum_{i = 1}^n f_i = 1$$
Die Funktion für die Häufigkeitsfunktion (auch genannt: Dichtefunktion) hat folgende Abkürzungen:
- Für diskrete Merkmale: _PMF_ (probability mass function)
- Für stetige Merkmale: _PDF_ (probability density function)
<div class="letters">
- $f_i$: Relative Häufigkeit
- $h_i$: Absolute Häufigkeit
- $n$: Anzahl Merkmalträger in der Stichprobe
</div>
# Glossar
- Univariate Daten: Daten, welche nur ein Merkmal haben