Absolute Häufigkeit
Der Begriff absolute Häufigkeit ist gleichbedeutend mit dem umgangssprachlichen Begriff „Anzahl“. Die absolute Häufigkeit ist ein Maß der deskriptiven Statistik und soll sich vom Begriff relative Häufigkeit abgrenzen.
Die absolute Häufigkeit ist das Ergebnis einer einfachen Zählung von Objekten oder Ereignissen (besser Elementarereignissen). Sie gibt an, wie viele Elemente mit dem gleichen interessierenden Merkmal gezählt wurden.
Als Anzahl kann sie nur eine natürliche Zahl sein. Wegen ihres festen Nullpunkts und der festen ganzzahligen Einheiten ist sie eine Absolutskala. Das heißt, ihr Nullpunkt und die Größe der Einheiten kann nicht sinnvoll verändert werden. Im Gegensatz zur relativen Häufigkeit sind die Werte der absoluten Häufigkeit also absolut, sprich unveränderlich. Ihr Wertebereich geht von 0 bis Unendlich.
Für den Vergleich von Teilmengen unterschiedlich großer Grundmengen eignet sich hingegen die absolute Häufigkeit nicht. Die Höhe der absoluten Häufigkeit hängt vom Umfang der betrachteten Grundmenge ab, was diesen Vergleich unsinnig macht. Für einen solchen Vergleich wird deshalb ein normiertes Maß, die relative Häufigkeit, verwendet.
Regel
BearbeitenWenn bei Beobachtungen eines Zufallversuchs bzw. bei der Überprüfung einer Stichprobe das Ereignis insgesamt -mal auftritt, dann heißt diese Größe die absolute Häufigkeit des Ereignisses . Die Abkürzung der relativen Häufigkeit ist .
Beispiel
BearbeitenBei der Betrachtung symmetrischer Daten bietet sich eine vorherige Klassierung an. Man bildet dann die absoluten Häufigkeiten der Klassen. In einer Umfrage werden 453 Personen nach ihrem Alter befragt. Bei der Auszählung stellt man fest, dass 197 Personen in die Klasse „von 20 Jahre bis unter 30 Jahre“ fallen. Damit ist die absolute Häufigkeit dieser Klasse 197.
Absolute Häufigkeit in der medizinischen Statistik
BearbeitenDie absolute Häufigkeit kann anstelle der Wahrscheinlichkeit angegeben werden, um das Verständnis von Risiken und Testbefunden zu erleichtern, und wird daher besonders in der Statistik und Wahrscheinlichkeitsrechnung verwandt. Die Angabe erfolgt in „X von Y“, also zum Beispiel „8 von 1000“. Diese Angabe ist eine Normierung der natürlichen Häufigkeit (zum Beispiel „1 von 125“).
Mittels der Darstellung in absoluten Häufigkeiten können medizinische Testergebnisse einfacher interpretiert werden. Eine alternative Berechnung bietet der Satz von Bayes.
Ein Beispiel (ohne Angaben von Wahrscheinlichkeiten)
- 10 von 1000 symptomfreien Personen haben eine Krankheit (der so genannte Grundanteil). Bei 8 von den 10 Personen, die diese Krankheit haben, fällt ein spezieller medizinischer Test positiv aus (Sensitivität = 8⁄10 = 80 %), bei den 990 gesunden Menschen fällt der Test dennoch bei 99 positiv aus, also nur bei 891 negativ (Spezifität = 891⁄990 = 90 %). Frage: Wie viele der Untersuchten mit positivem Ergebnis sind tatsächlich erkrankt?
Ein Entscheidungsbaum ist hilfreich, um das Problem zu visualisieren.
Eine Darstellung im Entscheidungsbaum:
1000 / \ krank / \ gesund / \ 10 990 /\ /\ / \ / \ − / \ + + / \ − / \ / \ 2 8 99 891
- „+“ … positives Testergebnis
- „−“ … negatives Testergebnis
Ergebnis: Von den 107 (= 8 + 99) Personen mit positivem Testergebnis sind nur 8 Personen wirklich erkrankt, also weniger als jeder 10. der untersuchten Personen. Das alles ohne andere Untersuchungen.
Bemerkung: Falsch sind die Ergebnisse offensichtlich bei 101 Personen. 99 Personen sind gesund, werden aber im Testergebnis als krank betrachtet (falsch positiv) und 2 Personen sind krank, werden aber im Testergebnis als gesund betrachtet (falsch negativ).
Diese Visualisierung der Häufigkeiten mit einem Entscheidungsbaum hat folgende Vorteile für das Verstehen des Satzes von Bayes:
- Das Betrachten von Mengen und Teilmengen („8“ von „10“) fällt oft leichter als das Berechnen von Wahrscheinlichkeiten in Prozent und den Gegenwahrscheinlichkeiten.
- Die Übersetzung in Wahrscheinlichkeiten entfällt und die Interpretation des Ergebnisses ist leichter.
- Einfachheit: das Kombinieren mehrerer Regeln entfällt, besonders die schwer zu verstehende Inversion (aus soll etwas über ausgesagt werden) im Satz von Bayes.
- Sequenzargument. Die hierarchisch-sequentiellen Entscheidungen sind leicht darzustellen.