97 lines
3.3 KiB
Markdown
97 lines
3.3 KiB
Markdown
# Stochastik und Statistik
|
|
|
|
- [Stochastik und Statistik](#stochastik-und-statistik)
|
|
- [Deskriptive Statistik](#deskriptive-statistik)
|
|
- [Merkmals-Typen](#merkmals-typen)
|
|
- [Häufigkeiten](#häufigkeiten)
|
|
- [Glossar](#glossar)
|
|
|
|
## Deskriptive Statistik
|
|
Ermittlung von Kenngrössen und Datenvalidierung
|
|
|
|
### Merkmals-Typen
|
|
```mermaid
|
|
flowchart TD
|
|
r[Merkmals-Typ]
|
|
q[Qualitativ/Kategoriell]
|
|
m[Quantitativ/Metrisch]
|
|
n[Nominal]
|
|
o[Ordinal]
|
|
d[Diskret]
|
|
s[Stetig]
|
|
r --> q
|
|
r --> m
|
|
q --> n
|
|
q --> o
|
|
m --> d
|
|
m --> s
|
|
```
|
|
|
|
- Qualitativ/Kategoriell - Unmessbar
|
|
- Nominal: Nicht mit bestimmtem Wert verbunden
|
|
- Ordinal: Mit Wert verbunden
|
|
- Quantitativ/Metrisch - Messbar
|
|
- Diskret: Nur bestimmte Werte möglich
|
|
- Stetig: Jegliche Werte möglich
|
|
|
|
***Beispiele:***
|
|
|
|
Frage: Welche Sprache sprichst du?
|
|
|
|
| Ausprägungen | Merkmal-Typ |
|
|
| ------------------------------------------------ | ----------- |
|
|
| Deutsch, Französisch, Italienisch, Rätoromanisch | Nominal |
|
|
|
|
Frage: Ich würde das Produkt weiterempfehlen
|
|
|
|
| Ausprägungen | Merkmal-Typ |
|
|
| ------------------------------------------------------------------------------ | ----------- |
|
|
| Stimme nicht zu, Stimme eher nicht zu, Keine Angabe, Stimme eher zu, Stimme zu | Ordinal |
|
|
|
|
Frage: Wieviele Male hast du heute Steam gestartet?
|
|
|
|
| Ausprägungen | Merkmal-Typ | Bemerkung |
|
|
| ------------------ | ----------- | --------------------------------------------------- |
|
|
| Ganze Zahlen $> 0$ | Diskret | Es sind keine beliebigen Werte möglich (bspw. 0.5). |
|
|
|
|
Frage: Was ist dein Welt-Rekord im 100-Meter-Lauf?
|
|
|
|
| Ausprägungen | Merkmal-Typ | Bemerkung |
|
|
| -------------- | ----------- | ---------------------------------------------------------------- |
|
|
| Beliebige Zeit | Stetig | Jegliche Zahlen (mit beliebig vielen Kommastellen) sind möglich. |
|
|
|
|
Frage: Wieviel kostet ein Mars-Riegel?
|
|
|
|
| Ausprägungen | Merkmal-Typ | Bemerkung |
|
|
| ----------------------- | ----------- | ------------------------------------------------------------------- |
|
|
| Beliebiger Preis in CHF | Diskret | Beträge, die nicht durch 5 Rappen teilbar sind, sind nicht möglich. |
|
|
|
|
## Häufigkeiten
|
|
Eine Häufigkeit ist die Anzahl Male, die ein Merkmalsträger in der Stichprobe eine bestimmte Eigenschaft erfüllt.
|
|
Diese kann auf verschiedene Weisen dargestellt werden.
|
|
|
|
- ***Absolute Häufigkeit $h_i$:*** Die absolute Häufigkeit ist die Anzahl der gezählten Elemente.
|
|
- ***Relative Häufigkeit $f_i$:*** Ergibt sich, indem man die absolute Häufigkeit durch den Stichproben-Umfang teilt.
|
|
$$f_i = \frac{h_i}{n}$$
|
|
|
|
Zudem gelten folgende Regeln:
|
|
|
|
$$\sum_{i = 1}^n h_i = n$$
|
|
$$\sum_{i = 1}^n f_i = 1$$
|
|
|
|
Die Funktion für die Häufigkeitsfunktion (auch genannt: Dichtefunktion) hat folgende Abkürzungen:
|
|
|
|
- Für diskrete Merkmale: _PMF_ (probability mass function)
|
|
- Für stetige Merkmale: _PDF_ (probability density function)
|
|
|
|
<div class="letters">
|
|
|
|
- $f_i$: Relative Häufigkeit
|
|
- $h_i$: Absolute Häufigkeit
|
|
- $n$: Anzahl Merkmalträger in der Stichprobe
|
|
|
|
</div>
|
|
|
|
# Glossar
|
|
- Univariate Daten: Daten, welche nur ein Merkmal haben
|