# Stochastik und Statistik - [Stochastik und Statistik](#stochastik-und-statistik) - [Deskriptive Statistik](#deskriptive-statistik) - [Merkmals-Typen](#merkmals-typen) - [Häufigkeiten](#häufigkeiten) - [Glossar](#glossar) ## Deskriptive Statistik Ermittlung von Kenngrössen und Datenvalidierung ### Merkmals-Typen ```mermaid flowchart TD r[Merkmals-Typ] q[Qualitativ/Kategoriell] m[Quantitativ/Metrisch] n[Nominal] o[Ordinal] d[Diskret] s[Stetig] r --> q r --> m q --> n q --> o m --> d m --> s ``` - Qualitativ/Kategoriell - Unmessbar - Nominal: Nicht mit bestimmtem Wert verbunden - Ordinal: Mit Wert verbunden - Quantitativ/Metrisch - Messbar - Diskret: Nur bestimmte Werte möglich - Stetig: Jegliche Werte möglich ***Beispiele:*** Frage: Welche Sprache sprichst du? | Ausprägungen | Merkmal-Typ | | ------------------------------------------------ | ----------- | | Deutsch, Französisch, Italienisch, Rätoromanisch | Nominal | Frage: Ich würde das Produkt weiterempfehlen | Ausprägungen | Merkmal-Typ | | ------------------------------------------------------------------------------ | ----------- | | Stimme nicht zu, Stimme eher nicht zu, Keine Angabe, Stimme eher zu, Stimme zu | Ordinal | Frage: Wieviele Male hast du heute Steam gestartet? | Ausprägungen | Merkmal-Typ | Bemerkung | | ------------------ | ----------- | --------------------------------------------------- | | Ganze Zahlen $> 0$ | Diskret | Es sind keine beliebigen Werte möglich (bspw. 0.5). | Frage: Was ist dein Welt-Rekord im 100-Meter-Lauf? | Ausprägungen | Merkmal-Typ | Bemerkung | | -------------- | ----------- | ---------------------------------------------------------------- | | Beliebige Zeit | Stetig | Jegliche Zahlen (mit beliebig vielen Kommastellen) sind möglich. | Frage: Wieviel kostet ein Mars-Riegel? | Ausprägungen | Merkmal-Typ | Bemerkung | | ----------------------- | ----------- | ------------------------------------------------------------------- | | Beliebiger Preis in CHF | Diskret | Beträge, die nicht durch 5 Rappen teilbar sind, sind nicht möglich. | ## Häufigkeiten Eine Häufigkeit ist die Anzahl Male, die ein Merkmalsträger in der Stichprobe eine bestimmte Eigenschaft erfüllt. Diese kann auf verschiedene Weisen dargestellt werden. - ***Absolute Häufigkeit $h_i$:*** Die absolute Häufigkeit ist die Anzahl der gezählten Elemente. - ***Relative Häufigkeit $f_i$:*** Ergibt sich, indem man die absolute Häufigkeit durch den Stichproben-Umfang teilt. $$f_i = \frac{h_i}{n}$$ Zudem gelten folgende Regeln: $$\sum_{i = 1}^n h_i = n$$ $$\sum_{i = 1}^n f_i = 1$$ Die Funktion für die Häufigkeitsfunktion (auch genannt: Dichtefunktion) hat folgende Abkürzungen: - Für diskrete Merkmale: _PMF_ (probability mass function) - Für stetige Merkmale: _PDF_ (probability density function)
- $f_i$: Relative Häufigkeit - $h_i$: Absolute Häufigkeit - $n$: Anzahl Merkmalträger in der Stichprobe
# Glossar - Univariate Daten: Daten, welche nur ein Merkmal haben