Die Kolmogorow-Verteilung ist eine stetige Wahrscheinlichkeitsverteilung, die als Grenzverteilung einer Teststatistik des Kolmogorow-Smirnow-Anpassungstests für einen über alle Grenzen wachsenden Stichprobenumfang auftritt.
Definition
Eine stetige Zufallsvariable heißt Kolmogorow-verteilt, falls sie die Verteilungsfunktion
hat.[1][2] Die zugehörige Wahrscheinlichkeitsverteilung heißt Kolmogorow-Verteilung.
Eigenschaften
Eine alternative Summendarstellung der Verteilungsfunktion[3][4] ist
Diese alternative Darstellung ist für numerische Berechnungen in bestimmten Fällen günstiger.[3]
Für eine Kolmogorow-verteilte Zufallsvariable gilt
Die Zufallsvariable hat den Erwartungswert
und die Varianz
Anwendung
Die Kolmogorow-Verteilung wird als approximative Wahrscheinlichkeitsverteilung der Teststatistik für die Durchführung eines approximativen Kolmogorow-Smirnow-Anpassungstests verwendet, falls der Stichprobenumfang hinreichend groß ist, um die asymptotische Verteilung der Teststatistik – nämlich die Kolmogorow-Verteilung – zu verwenden. Die -Quantile der Kolmogorow-Verteilung für sind näherungsweise .[5]
Eine Approximation der Verteilungsfunktion ergibt sich, wenn nur der erste Summand für verwendet wird,
Das -Quantil der Kolmogorow-Verteilung ergibt sich dann näherungsweise als Lösung der Gleichung . Dies führt zur Näherungsformel
- ,
die zu Werten führt, die bis zur dritten Nachkommastelle mit den oben angegebenen Tabellenwerten übereinstimmen. Manchmal wird diese Formel angegeben, ohne klarzustellen, dass es sich um eine doppelte Approximation handelt.[6] Die asymptotische Verteilung wird für endlichen Stichprobenumfang verwendet und dabei wird nur die Approximation der Kolomogorow-Verteilung verwendet. Wie der Vergleich der Funktionen und in der Abbildung zeigt, ist die Approximation zur Quantilbestimmung nur für hinreichend kleine Werte von anwendbar. Insbesondere ist die Approximation keine Verteilungsfunktion.
Theoretischer Hintergrund
Die reellwertigen Zufallsvariablen seien stochastisch unabhängig und identisch verteilt mit der stetigen Verteilungsfunktion .
- Dann hängt die Wahrscheinlichkeitsverteilung der Stichprobenfunktion
- wobei
- die zufällige empirische Verteilungsfunktion bezeichnet, nicht von ab. ist also bezüglich der Klasse aller stetigen Verteilungsfunktionen eine verteilungsfreie Statistik.
- Außerdem konvergiert die Folge in Verteilung gegen die Kolmogorow-Verteilung, es gilt daher
- .
ist die Teststatistik des Kolmogorov-Smirnov-Anpassungstest für den Stichprobenumfang . Sie heißt auch Kolmogorow-Smirnow-Statistik. Es gibt Tabellen für Quantile der Verteilung von .[7]
Für große Stichprobenumfänge können die Quantile der Kolmogorow-Verteilung verwendet werden.[5] Es gibt eine Tabelle für Werte der Verteilungsfunktion der Kolomogorov-Verteilung.[8]
Literatur
- Kevin Ford: From Kolmogorov’s theorem on empirical distribution to number theory. In: Eric Charpentier, Annick Lesne, Nikolai Kapitonowitsch Nikolski (Hrsg.): Kolmogorov’s Heritage in Mathematics. Springer, Berlin / Heidelberg 2007, ISBN 978-3-540-36349-1, S. 97–108, doi:10.1007/978-3-540-36351-4_5.
- A. Kolmogoroff: Sulla determinazione empirica di una legge di distribuzione. In: Giornale dell’Istituto italiano degli attuari. Band IV, Nr. 1, 1933, S. 83–91 (italienisch, sbn.it).
- A. Kolmogorov: On the Empirical Determination of a Distribution Function. In: Samuel Kotz, Norman L. Johnson (Hrsg.): Breakthroughs in Statistics, Volume II – Methodology and Distribution. Springer-Verlag, Berlin / Heidelberg / New York 1992, ISBN 3-540-94037-5, S. 106–113, doi:10.1007/978-1-4612-4380-9_10 (Übersetzt aus dem Italienischen von Quirino Meneghini, 1990).
- P. H. Müller (Hrsg.): Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991, ISBN 978-3-05-500608-1, Kolmogorow-Verteilung, S. 188–189, 627.
- M. A. Stephens: Introduction to Kolmogorov (1933) On the Empirical Determination of a Distribution Function. In: Samuel Kotz, Norman L. Johnson (Hrsg.): Breakthroughs in Statistics, Volume II – Methodology and Distribution. Springer-Verlag, Berlin / Heidelberg / New York 1992, ISBN 3-540-94037-5, S. 93–105, doi:10.1007/978-1-4612-4380-9_9.
Einzelnachweise und Anmerkungen
- ↑ Die leicht abweichende Darstellung
- ↑ Eine - vermutlich fehlerhafte – Darstellung der Verteilungsfunktion mit anstelle von findet sich in den beiden folgenden Quellen:
- N. Smirnov: Table for estimating the goodness of fit for empirical distributions. In: The Annals of Mathematical Statistics. Band 19, Nr. 2, 1948, S. 279–281, S. 279, JSTOR:2236278.
- William Feller: On the Kolmogorov-Smirnov limit theorems for empirical distributions. In: The Annals of Mathematical Statistics. Band 19, Nr. 2, 1948, S. 177–186, S. 178, JSTOR:2236265.
- Anirban DasGupta: Asymptotic Theory of Statistics and Probability. Springer, New York 2008, ISBN 978-0-387-75970-8, S. 425, doi:10.1007/978-0-387-75971-5.
- Jaroslav Hájek, Zbyněk Šidák, Pranab K. Sen: Theory of Rank Tests. 2. Auflage. Academic Press, San Diego et al. 1999, ISBN 978-0-12-642350-1, S. 247, doi:10.1016/B978-0-12-642350-1.X5017-6.
- Robert J. Serfling: Approximation Theorems of Mathematical Statistics. Wiley, New York 1980, ISBN 0-471-21927-4, S. 62.
- Galen R. Shorack, Jon A. Wellner: Empirical Processes with Applications in Statistics. Wiley, New York 1986, S. 142 (Unveränderter Nachdruck: SIAM, Philadelphia 2009, ISBN 978-0-89871-684-9).
- ↑ a b c Lexikon der Stochastik: Kolmogorow-Verteilung. S. 188.
- ↑ William Feller: On the Kolmogorov-Smirnov limit theorems for empirical distributions. In: The Annals of Mathematical Statistics. Band 19, Nr. 2, 1948, S. 177–186, S. 178, JSTOR:2236265.
- ↑ a b Z. B. Lexikon der Stochastik: Tafel XIII B: Kolmogorow-Test: Quantile der Kolmogorow-Verteilung. S. 627.
- ↑ Lothar Sachs, Jürgen Hedderich: Angewandte Statistik. Methodensammlung mit R. 17. Auflage. Springer Spektrum, Berlin / Heidelberg 2018, ISBN 978-3-662-62293-3, S. 496, doi:10.1007/978-3-662-62294-0.
- ↑ Z. B. Lexikon der Stochastik: Tafel XIII A: Kolmogorow-Test: Quantile . S. 625–626.
- ↑ N. Smirnov: Table for estimating the goodness of fit for empirical distributions. In: The Annals of Mathematical Statistics. Band 19, Nr. 2, 1948, S. 279–281, JSTOR:2236278. Diese Tabelle wurde zuerst abgedruckt in N. Smirnov: On the estimation of the discrepancy between empirical curves of distribution for two independent samples. In: Bulletin Mathématique de l'Université Moscou. Band 2, Nr. 2, 1939. Die Tabelle ist wiederabgedruckt auf S. 143 in Galen R. Shorack, Jon A. Wellner: Empirical Processes with Applications in Statistics. Wiley, New York 1986 (Unveränderter Nachdruck: SIAM, Philadelphia 2009, ISBN 978-0-89871-684-9).