Kolmogorow-Verteilung

Wahrscheinlichkeitsverteilung
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 22. August 2023 um 22:29 Uhr durch Sigma^2 (Diskussion | Beiträge) (Anwendung). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Die Kolmogorow-Verteilung ist eine stetige Wahrscheinlichkeitsverteilung, die als Grenzverteilung einer Teststatistik des Kolmogorow-Smirnow-Anpassungstests für einen über alle Grenzen wachsenden Stichprobenumfang auftritt.

Definition

Eine stetige Zufallsvariable   heißt Kolmogorow-verteilt, falls sie die Verteilungsfunktion

 

hat.[1][2] Die zugehörige Wahrscheinlichkeitsverteilung heißt Kolmogorow-Verteilung.

Eigenschaften

 
Kolmogorow-Verteilungsfunktion (rot) und   (blau)

Eine alternative Summendarstellung der Verteilungsfunktion[3][4] ist

 

Diese alternative Darstellung ist für numerische Berechnungen in bestimmten Fällen günstiger.[3]

Für eine Kolmogorow-verteilte Zufallsvariable   gilt

 

Die Zufallsvariable   hat den Erwartungswert

 

und die Varianz

 [3]

Anwendung

Die Kolmogorow-Verteilung wird als approximative Wahrscheinlichkeitsverteilung der Teststatistik für die Durchführung eines approximativen Kolmogorow-Smirnow-Anpassungstests verwendet, falls der Stichprobenumfang hinreichend groß ist, um die asymptotische Verteilung der Teststatistik – nämlich die Kolmogorow-Verteilung – zu verwenden. Die  -Quantile der Kolmogorow-Verteilung für   sind näherungsweise  .[5]

Eine Approximation der Verteilungsfunktion ergibt sich, wenn nur der erste Summand für   verwendet wird,

 

Das  -Quantil   der Kolmogorow-Verteilung ergibt sich dann näherungsweise als Lösung der Gleichung  . Dies führt zur Näherungsformel

 ,

die zu Werten führt, die bis zur dritten Nachkommastelle mit den oben angegebenen Tabellenwerten übereinstimmen. Manchmal wird diese Formel angegeben, ohne klarzustellen, dass es sich um eine doppelte Approximation handelt.[6] Die asymptotische Verteilung wird für endlichen Stichprobenumfang verwendet und dabei wird nur die Approximation   der Kolomogorow-Verteilung verwendet. Wie der Vergleich der Funktionen   und   in der Abbildung zeigt, ist die Approximation   zur Quantilbestimmung nur für hinreichend kleine Werte von   anwendbar. Insbesondere ist die Approximation   keine Verteilungsfunktion.

Theoretischer Hintergrund

Die reellwertigen Zufallsvariablen   seien stochastisch unabhängig und identisch verteilt mit der stetigen Verteilungsfunktion  .

 
wobei
 
die zufällige empirische Verteilungsfunktion bezeichnet, nicht von   ab.   ist also bezüglich der Klasse aller stetigen Verteilungsfunktionen eine verteilungsfreie Statistik.
  • Außerdem konvergiert die Folge   in Verteilung gegen die Kolmogorow-Verteilung, es gilt daher
 .

  ist die Teststatistik des Kolmogorov-Smirnov-Anpassungstest für den Stichprobenumfang  . Sie heißt auch Kolmogorow-Smirnow-Statistik. Es gibt Tabellen für Quantile der Verteilung von  .[7]

Für große Stichprobenumfänge können die Quantile der Kolmogorow-Verteilung verwendet werden.[5] Es gibt eine Tabelle für Werte der Verteilungsfunktion der Kolomogorov-Verteilung.[8]

Literatur

A. Kolmogorov: On the Empirical Determination of a Distribution Function. In: Samuel Kotz, Norman L. Johnson (Hrsg.): Breakthroughs in Statistics, Volume II – Methodology and Distribution. Springer-Verlag, Berlin / Heidelberg / New York 1992, ISBN 3-540-94037-5, S. 106–113, doi:10.1007/978-1-4612-4380-9_10 (Übersetzt aus dem Italienischen von Quirino Meneghini, 1990).
  • P. H. Müller (Hrsg.): Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991, ISBN 978-3-05-500608-1, Kolmogorow-Verteilung, S. 188–189, 627.
  • M. A. Stephens: Introduction to Kolmogorov (1933) On the Empirical Determination of a Distribution Function. In: Samuel Kotz, Norman L. Johnson (Hrsg.): Breakthroughs in Statistics, Volume II – Methodology and Distribution. Springer-Verlag, Berlin / Heidelberg / New York 1992, ISBN 3-540-94037-5, S. 93–105, doi:10.1007/978-1-4612-4380-9_9.

Einzelnachweise und Anmerkungen

  1. Die leicht abweichende Darstellung
     
    findet sich im Lexikon der Stochastik: Kolmogorow-Verteilung. S. 188. In dieser Form wurde die Verteilungsfunktion auch durch Kolmogorow in der Originalarbeit angegeben: A. Kolmogoroff: Sulla determinazione empirica di una legge di distribuzione. In: Giornale dell’Istituto italiano degli attuari. Band IV, Nr. 1, 1933, S. 83–91, S. 91 (italienisch, sbn.it). Diese ist äquivalent zur oben angegebenen Form.
  2. Eine - vermutlich fehlerhafte – Darstellung der Verteilungsfunktion   mit   anstelle von   findet sich in den beiden folgenden Quellen: Andererseits findet sich die in der Definition angegebene Form der Verteilungsfunktion mit dem Faktor 2 im Exponenten auch in diesen Quellen:
  3. a b c Lexikon der Stochastik: Kolmogorow-Verteilung. S. 188.
  4. William Feller: On the Kolmogorov-Smirnov limit theorems for empirical distributions. In: The Annals of Mathematical Statistics. Band 19, Nr. 2, 1948, S. 177–186, S. 178, JSTOR:2236265.
  5. a b Z. B. Lexikon der Stochastik: Tafel XIII B: Kolmogorow-Test: Quantile der Kolmogorow-Verteilung. S. 627.
  6. Lothar Sachs, Jürgen Hedderich: Angewandte Statistik. Methodensammlung mit R. 17. Auflage. Springer Spektrum, Berlin / Heidelberg 2018, ISBN 978-3-662-62293-3, S. 496, doi:10.1007/978-3-662-62294-0.
  7. Z. B. Lexikon der Stochastik: Tafel XIII A: Kolmogorow-Test: Quantile  . S. 625–626.
  8. N. Smirnov: Table for estimating the goodness of fit for empirical distributions. In: The Annals of Mathematical Statistics. Band 19, Nr. 2, 1948, S. 279–281, JSTOR:2236278. Diese Tabelle wurde zuerst abgedruckt in N. Smirnov: On the estimation of the discrepancy between empirical curves of distribution for two independent samples. In: Bulletin Mathématique de l'Université Moscou. Band 2, Nr. 2, 1939. Die Tabelle ist wiederabgedruckt auf S. 143 in Galen R. Shorack, Jon A. Wellner: Empirical Processes with Applications in Statistics. Wiley, New York 1986 (Unveränderter Nachdruck: SIAM, Philadelphia 2009, ISBN 978-0-89871-684-9).