ZHAWNotes/Notes/Semester 3/STS - Stochastik und Statistik/Summary.md

3.3 KiB

Stochastik und Statistik

Deskriptive Statistik

Ermittlung von Kenngrössen und Datenvalidierung

Merkmals-Typen

flowchart TD
  r[Merkmals-Typ]
  q[Qualitativ/Kategoriell]
  m[Quantitativ/Metrisch]
  n[Nominal]
  o[Ordinal]
  d[Diskret]
  s[Stetig]
  r --> q
  r --> m
  q --> n
  q --> o
  m --> d
  m --> s
  • Qualitativ/Kategoriell - Unmessbar
    • Nominal: Nicht mit bestimmtem Wert verbunden
    • Ordinal: Mit Wert verbunden
  • Quantitativ/Metrisch - Messbar
    • Diskret: Nur bestimmte Werte möglich
    • Stetig: Jegliche Werte möglich

Beispiele:

Frage: Welche Sprache sprichst du?

Ausprägungen Merkmal-Typ
Deutsch, Französisch, Italienisch, Rätoromanisch Nominal

Frage: Ich würde das Produkt weiterempfehlen

Ausprägungen Merkmal-Typ
Stimme nicht zu, Stimme eher nicht zu, Keine Angabe, Stimme eher zu, Stimme zu Ordinal

Frage: Wieviele Male hast du heute Steam gestartet?

Ausprägungen Merkmal-Typ Bemerkung
Ganze Zahlen > 0 Diskret Es sind keine beliebigen Werte möglich (bspw. 0.5).

Frage: Was ist dein Welt-Rekord im 100-Meter-Lauf?

Ausprägungen Merkmal-Typ Bemerkung
Beliebige Zeit Stetig Jegliche Zahlen (mit beliebig vielen Kommastellen) sind möglich.

Frage: Wieviel kostet ein Mars-Riegel?

Ausprägungen Merkmal-Typ Bemerkung
Beliebiger Preis in CHF Diskret Beträge, die nicht durch 5 Rappen teilbar sind, sind nicht möglich.

Häufigkeiten

Eine Häufigkeit ist die Anzahl Male, die ein Merkmalsträger in der Stichprobe eine bestimmte Eigenschaft erfüllt. Diese kann auf verschiedene Weisen dargestellt werden.

  • Absolute Häufigkeit h_i: Die absolute Häufigkeit ist die Anzahl der gezählten Elemente.
  • Relative Häufigkeit f_i: Ergibt sich, indem man die absolute Häufigkeit durch den Stichproben-Umfang teilt.
    f_i = \frac{h_i}{n}

Zudem gelten folgende Regeln:

\sum_{i = 1}^n h_i = n
\sum_{i = 1}^n f_i = 1

Die Funktion für die Häufigkeitsfunktion (auch genannt: Dichtefunktion) hat folgende Abkürzungen:

  • Für diskrete Merkmale: PMF (probability mass function)
  • Für stetige Merkmale: PDF (probability density function)
  • f_i: Relative Häufigkeit
  • h_i: Absolute Häufigkeit
  • n: Anzahl Merkmalträger in der Stichprobe

Glossar

  • Univariate Daten: Daten, welche nur ein Merkmal haben