13 - Grundbegriffe der deskriptive Statistik

  • erhobene Daten: statistische Einheiten, Untersuchungseinheiten oder Merkmalsträger, Versuchseinheiten (durch Experimente gewonnen), Beobachtungseinheiten (Beobachtungsstudien)
  • Menge der statistischen Einheiten: Grundgesamtheit oder Population
  • Teilauswahl einer Grundgesamtheit: Stichprobe; Stichprobe ist repräsentativ, wenn bezüglich wichtiger Charakteristika strukturgleich zur Grundgesamtheit
  • vorgegebene Quoten, die Stichprobe einhalten muss: quotierte Teilauswahl
  • (einfache) Zufallsstichprobe: jede Teilmenge der Grundgesamtheit hat gleiche Wahrscheinlichkeit, gezogen zu werden
  • interessierende Größen der statistischen Einheiten: Merkmale oder Variablen
  • Mögliche Werte eines Merkmals: Merkmalsausprägungen oder (mögliche) Ausprägungen
  • nur endlich viele oder abzählbar unendlich viele Ausprägungen möglich: diskretes Merkmal, sonst stetiges Merkmal

Skalen

  • Nominalskala: Ausprägungen stehen in keiner Beziehung zueinander; nur zwei Ausprägungen: dichotome oder binäre Variable
  • Ordinalskala: Ausprägungen sind vergleichbar
  • Metrische Skala (Kardinalskala): Ausprägungen sind Vielfache einer Grundeinheit; Intervallskala: Nullpunkt willkürlich, sonst Verhältnis-, Quotienten- oder Ratioskala

Studiendesigns

  • Querschnittstudie (engl.: cross-sectional study): fester Zeitpunkt, interessierende Merkmale werden an statistischen Einheiten erhoben
  • Longitudinalstudie: Merkmale werden zu verschiedenen Zeitpunkten an festem Kollektiv (Panel) erhoben

Aufbereitung von Daten

  • Rohdaten (Pimärdaten, Urliste) mit \(p\) Merkmalen (Dimension der Daten) an \(n\) statistischen Einheiten (Stichprobenumfang) in \(n\times p\)-Matrix (Datenmatrix) darstellbar
  • p=1: univariate Daten, sonst multivariate Daten
  • Der Vektor $$\textbf{x}=(x_1,\ldots,x_n) \in \mathbb{R}^n$$ der \(n\) Ausprägungen eines Merkmals heißt Datenvektor