Keskeinen raja-arvolause

Wikipediasta
Siirry navigaatioon Siirry hakuun

Keskeinen raja-arvolause on toden­näköisyys­laskennan tulos, jonka mukaan keskiarvo riittävän suuresta määrästä toisistaan riippumattomia satunnais­muuttujia, joista kullakin on hyvin määritelty odotusarvo ja varianssi, on tietyin edellytyksin likipitäen normaalisti jakautunut riippumatta kunkin satunnaismuuttujan omasta jakaumasta.[1][2]

Lausetta voi havainnollistaa muodostamalla suuren määrän havaintoja käsittävä otos, jossa kukin havainto on generoitu satunnaisesti muista havaintokerroista riippumatta. Tämän jälkeen lasketaan otoksen eli havaintojen keskiarvo. Jos tämä toistetaan monta kertaa, keskeisen raja-arvo­lauseen mukaan niiden keskiarvo jakautuu toden­näköisesti sitä tarkemmin normaali­jakauman eli niin sanotun kellokäyrän mukaisesti. Esimerkiksi jos kolikkoa heitetään erittäin monta kertaa, toden­näköisyys saada kruuna tietyllä määrällä kertoja noudattaa normaali­jakaumaa, jonka odotusarvo on puolet heittojen lukumäärästä.

Keskeisestä raja-arvo­lauseesta on monia muunnelmia. Sen kauimmin tunnettu muoto edellyttää, että satunnais­muuttujat, joiden keskiarvoa tarkastellaan, ovat samoin jakautuneet. Satunnais­muuttujien keskiarvo kuitenkin suppenee kohti normaali­jakaumaa tietyin edellytyksin useissa sellaisissakin tapauksissa, joissa ne eivät ole samoin jakautuneet eivätkä edes toisistaan riippumattomat.

Yleisimmässä mielessä keskeiset raja-arvolauseet ovat koko joukko toden­näköisyys­laskennan raja-arvo­lauseita. Ne kaikki ilmaisevat eri tavoin, että monen riippumattoman ja identtisesti jakautuneen tai tietyin edellytyksin myös tavalla tai toisella toisistaan riippuvankin satunnais­muuttujan summalla on taipumus noudattaa jakaumaa, joka kuuluu pieneen joukkoon attraktorijakaumaa. Kun riippumattomien ja identtisten jakautuneiden satunnais­muuttujien varianssi on äärellinen, tämä attraktori­jakauma on normaali­jakauma. Sitä vastoin jos muodostetaan sellaisten satunnais­muuttujien summa, joilla on potenssi­lain mukainen, funktion |x|-α-1 mukaisesti (0 < α < 2) pienenevä "häntä" ja joiden varianssi näin ollen on ääretön, se suppenee kohti alfa-vakaata jakaumaa, jonka vakausparametri muuttujien lukumäärän kasvaessa on α[3]

Tilastotieteessä keskeisellä raja-arvolauseella on perustava merkitys käsiteltäessä suuria otoksia jostakin aineistosta. Sen sijaan pieniä otoksia käsiteltäessä se ei ole yhtä käyttö­kelpoinen.[4]

Keskeisiä raja-arvolauseita riippumattomille jonoille

[muokkaa | muokkaa wikitekstiä]

Klassinen keskeinen raja-arvolause

[muokkaa | muokkaa wikitekstiä]

Olkoon {X1, ..., Xn} n alkion satunnais­otos, toisin sanoen jono riippumattomia ja identtisesti jakautuneita satunnais­muuttujia, joilla kaikilla on sama odotusarvo on μ ja sama äärellinen varianssi σ2. Tarkastellaan näiden satunnaismuuttujien otoskeskiarvoa

.

suurten lukujen lain mukaan otoskeskiarvo suppenee stokastisesti ja melkein varmasti kohti odotusarvoa μ, kun n kasvaa rajatta. Klassinen keskeinen raja-arvolause kuvaa stokastisten fluktuaatioiden suuruutta ja niiden jakauman muotoa tämä raja-arvon μ molemmin puolin suppenemisen aikana. Tarkemmin sanottuna se sanoo, että kun n kasvaa, otoskeskiarvon Sn ja sen raja-arvon μ erotuksen jakauma, kun se kerrotaan tekijällä , toisin sanoen tulon jakauma) lähestyy normaalijakaumaa, jonka keskiarvo on 0 ja varianssi σ2. Tarpeeksi suurella n:n arvolla Sn:n jakauma on lähellä normaali­jakaumaa, jonka keskiarvo on μ ja varianssi σ2/n. Tuloksen merkitys perustuu siihen, että lausekkeen jakauma lähestyy normaali­jakaumaa riippumatta siitä, millainen jakauma alku­peräisillä satunnais­muuttujilla Xi itsellään on. Täsmällisessä muodossa lause voidaan esittää seuraavasti:

Lindebergin–Lévyn keskeinen raja-arvolause. Olkoon {X1, X2, ...}

jono riippumattomia ja identtisesti jakautuneita satunnais­muuttujia, joiden odotusarvo on E[Xi] = µ ja varianssi Var[Xi] = σ2 < ∞. Tällöin kun n kasvaa rajatta, satunnais­muuttujat konvergoivat jakaumaltaan kohti normaalijakaumaa N(0, σ2):[5]

Tapauksessa s > 0, jakauma­konvergenssi merkitsee, että lausekkeen jakauman kertymäfunktio suppenee pisteittäisesti kohti normaali­jakauman N (0, σ2 kertymä­funktiota jokaisella reaali­luvulla z,

missä F(x) on normaali­jakauman kertymä­funktion arvo pisteessä x. Suppeneminen on myös tasaista pisteessä z siinä mielessä, että

missä sup tarkoittaa joukon pienintä ylärajaa eli supremumia.[6]

Ljapunovin keskeinen raja-arvolause

[muokkaa | muokkaa wikitekstiä]

Tämä lause on saanut nimensä venäläisen matemaatikko Aleksandr Ljapunovin mukaan. Tämä keskeisen raja-arvo­lauseen muunnelma edellyttää, että satunnais­muuttujien Xi on oltava riippumattomat, mutta ei välttämättä identtisesti jakautuneet. Lause edellyttää myös, että satunnais­muuttujilla |Xi| on oltava asteiden (2 + δ) momentit ja että näiden momenttien kasvu on rajoitettu jäljempänä selitetyllä Ljapunovin ehdon mukaisella tavalla.

Ljapunovin keskeinen raja-arvolause.

[7] Olkoon {X1, X2, ...} jono riippumattomia satunnais­muuttujia, joista jokaisen odotusarvo on µi ja varianssi σi2. Määritellään

Jos jollakin arvolla δ > 0, pätee Ljapunovin ehto

niin summa (Xi - µi)/sn konvergoi jakaumaltaan kohti standardia normaalijakaumaa, kun n kasvaa rajatta:

Käytännössä on tavallisesti helpointa tarkistaa, päteekö Ljapunovin ehto arvolla δ = 1. Jos satunnais­muuttujien jono toteuttaa Ljapunovin ehdon, se toteuttaa myös Lindebergin ehdon. Kääntäen ei kuitenkaan Lindebergin ehdosta seuraa Ljapunovin ehto.

Lindebergin–Fellerin lause

[muokkaa | muokkaa wikitekstiä]

Suomalainen matemaatikko Jarl Waldemar Lindeberg osoitti vuonna 1920, että keskeisen raja-arvolauseen edellytyksenä ollut Ljapunovin ehto voidaan korvata heikommalla Lindebergin ehdolla. Myöhemmin William Feller osoitti, että Lindebergin ehto on myös välttämätön ehto sille, että summa konvergoi jakaumaltaan kohti normaalijakaumaa. Täten kysymyksen siitä, millä ehdoilla keskeinen raja-arvolause pätee, voidaan katsoa saaneen tyhjentävän ratkaisun.[8]

Olkoon {X1, X2, ...} jono riippumattomia satunnais­muuttujia, joista jokaisen odotusarvo on µi ja varianssi σi2. Oletetaan lisäksi, että

, missä .

Tällöin summa (Xi - µi)/sn konvergoi jakaumaltaan kohti standardia normaalijakaumaa, kun n kasvaa rajatta, jos ja vain jos seuraava Lindebergin ehto pätee:[8]

kaikilla ε > 0.

Moniulotteinen keskeinen raja-arvolause

[muokkaa | muokkaa wikitekstiä]

Todistukset, joissa käytetään karakteristisia funktioita, voidaan yleistää tapauksiin, joissa kukin muuttuja Xi on satunnaisvektori avaruudessa , jonka vektori­arvoinen odotus­arvo on µ = E(Xi) ja vektorin komponenteista muodostettu kovarianssimatriisi S, ja nämä satunnaisvektorit ovat riippumattomat ja identtisesti jakautuneet. Näiden vektorien summaus on suoritettava komponenteittain. Moniulotteinen keskeinen raja-arvolause sanoo, että skaalattuina nämä summat suppenevat kohti moniulotteista normaalijakaumaa.[9]

Olkoon

k-vektori. Lihavointi merkinnässä Xi osoittaa, että kyseessä on satunnaisvektori, ei yksiulotteinen satunnaismuuttuja. Tällöin satunnaisvektorien summa on

ja keskiarvo

ja sen vuoksi

.

Moniulotteinen keskeinen raja-arvolause osoittaa, että

missä kovarianssimatriisi S on

Yleistetty lause

[muokkaa | muokkaa wikitekstiä]

Keskeinen raja-arvolause sanoo, että riippumattoman ja identtisesti jakautuneiden satunnaismuuttujien summa, kun niillä on äärellinen varianssi, lähestyy suurella todennäköisyydellä normaalijakaumaa, kun muuttujien lukumäärä kasvaa. Gnedenko ja Kolmogorov keksivät lauseelle yleistyksen, joka koskee sellaisiakin satunnaismuuttujia, joiden jakaumat ääripäissään pienenevät potenssilain mukaan kuten |x|-a-1, missä 0 < a < 2, ja joiden varianssi tämän vuoksi on ääretön; tällainen on esimerkiksi Pareton jakauma. Tällaisissakin tapauksissa satunnaismuuttujien summa suppenee kohti jotakin vakaata jakaumaa , kun yhteenlaskettavien lukumäärä kasvaa.[10][11] Jos a > 2, tämä summa suppenee kohti vakaata jakaumaa, jonka vakausparametri on arvoltaan 2, toisin sanoen Gaussin jakaumaa.[12]

Keskeisiä raja-arvolauseita riippuville prosesseille

[muokkaa | muokkaa wikitekstiä]

Klassisen keskeisen raja-arvolauseen todistus

[muokkaa | muokkaa wikitekstiä]

Keskeisen raja-arvolauseen klassinen voidaan todistaa melko helposti karakterististen funktioiden avulla. Todistus on samantapainen kuin heikon suurten lukujen lain. Taylorin lauseen mukaan jokaisen sellaisen satunnaismuuttujan Y karakteristinen funktio, jonka odotusarvo on nolla ja varianssi var(Y) = 1), on

missä o on jokin t:n funktio, joka suppenee kohti nollaa nopeammin kuin t2.

Olettamalla, että Yi on (Xi - µ)/s eli Xi:n standardoitu arvo on helppo huomata, että havaintojen X1, X2, ..., Xn standardoitu keskiarvo on

Karakterististen funktioiden perusominaisuuksien nojalla summan karakteristinen funktio on:

niin että kun eksponenttifunktio voidaan esittää raja-arvona

,

Zn:n karakteristinen funktio on

Mutta tämä on sama kuin standardin normaalijakauman N(0, 1), karakteristinen funktio, ja keskeinen raja-arvolause seuraa Lévyn jatkuvuuslauseesta, joka takaa, että karakterististen funktioiden suppenemisesta seuraa jakaumien konvergenssi.

Suppeneminen kohti raja-arvoa

[muokkaa | muokkaa wikitekstiä]

Keskeinen raja-arvolause antaa vain asymptoottisen jakauman. Äärelliselle äärelliselle määrälle havaintoja se antaa järkevän likiarvon vain lähellä normaalijakauman huippua; tarvitaan erittäin suuri määrä havaintoja, jotta tulos pätisi myös jakauman kummassakin ääripäässä.

Jos kolmas keskeinen momentti E((X1 - μ)3) on olemassa ja se on äärellinen, mainittu suppeneminen on tasaista ja suppenemisvauhti on vähintään luokkaa 1/n1/2 (katso Berryn-Esseenin lause). Steinin metodia[13] voidaan käyttää, paitsi keskeisen raja-arvolauseen todistamiseen, myös suppenemisvauhdin arvioimiseen valitulla mitta-asteikolla.[14]

Suppeneminen normaali­jakaumaa kohti on mono­tonista siinä mielessä, että Zn:n entropia kasvaa mono­tonisesti kohti normaali­jakauman entropiaa.[15]

Keskeinen raja-arvolause pätee erityisesti myös riippumattomien ja identtisesti jakautuneiden diskreettien satunnais­muuttujien keskiarvolle. Diskreettien satunnais­muuttujien summa on yhä diskreetti satunnais­muuttuja, joten tässä on kysymyksessä jono diskreettejä satunnais­muuttujia, joiden kertymäfunktio suppenee kohti jatkuvan jakauman, nimittäin normaalijakauman kertymäfunktiota. Tämä merkitsee, että jos n riippumattoman identtisen satunnais­muuttujan toteutuneista summista laaditaan histogrammi ja piirretään käyrä, joka yhdistää histo­grammin muodostavien suorakulmioiden ylä­reunojen kesk­ipisteet, tämä käyrä muistuttaa muodoltaan Gaussin käyrää sitä tarkemmin, mitä suurempi luku n on. Tätä tulosta sanotaan de Moivren–Laplacen lauseeksi. Esimerkiksi jos lasketaan sellaisten satunnais­muuttujien summa, joista kullakin on vain kaksi mahdollista arvoa, tämä summa noudattaa binomijakaumaa, joka lähestyy muodoltaan normaali­jakaumaa sitä enemmän, mitä enemmän näitä yhteen­laskettuja satunnais­muuttujia on.

Keskeinen raja-arvolause ja suurten lukujen laki

[muokkaa | muokkaa wikitekstiä]

Keskeisen raja-arvolauseen tavoin myös suurten lukujen laki on osittainen ratkaisu yleiseen ongelmaan: Mitä riippumattomien ja identtisesti jakautuneiden satunnais­muuttujien summalle Sn tai niiden keskiarvolle lopulta tapahtuu kun satunnais­muuttujien lukumäärä n kasvaa rajatta?

Matemaattisessa analyysissä asymptoottiset sarjat kuuluvat käytetyimpiin työkaluihin senlaatuisten kysymysten käsittelyssä. Oletetaan, että f(n):llä on asymptoottinen kehitelmä:

Jakamalla molemmat puolet f1(n):llä ja ottamalla raja-arvo saadaan a1, kehitelmän korkeimman asteen termin kerroin, joka osoittaa, kuinka nopeasti f(n):n johtava termi muuttuu.

Epämuodollisesti voidaan sanoa, että "f(n) kasvaa likiptäen samassa tahdissa kuin a1 f1(n)". Jos f(n):n ja sen likiarvon erotus jaetaan kehitelmän seuraavalla termillä saadaan f(n):lle tarkempi arvio:

Tässä voidaan sanoa, että funktion ja sen likiarvon erotus kasvaa likipitäen saman verran kuin a2 f2(n). Ajatuksena on, että kun funktio jaetaan sopivilla normalisointi­funktioilla ja tutkitaan, miten näin saadulle funktiolle käy n:n kasvaessa voidaan päätellä paljon myös siitä, miten alkuperäiselle funktiolle silloin tapahtuu

Kutakuinkin samaan tapaan voidaan tarkastella myös riippumattomien ja identtisesti jakautuneiden satunnais­muuttujien X1, ..., Xn summaa Sn. Jos jokaisella Xi on äärellinen odotusarvo μ suurten lukujen lain mukaan niiden keskiarvo lähestyy tätä odotusarvoa eli Sn/n → µ.[16] Jos lisäksi jokaisella Xi on äärellinen varianssi σ2, niin keskeisen raja-arvolauseen mukaan

missä ξ noudattaa normaali­jakaumaa N(0, σ2). Tästä saadaan kahden ensimmäisen vakion arvot epämuodollisessa kehitelmässä

Tapauksessa, jossa satunnais­muuttujilla Xi ei ole äärellistä keskiarvoa tai varianssia, niiden summalle voidaan silti sopivasti muuntamalla ja uudelleen skaalaamalla saada suppeneva lauseke:

tai vähemmän muodollisesti

Tällä tavoin saatuja jakaumia Ξ sanotaan vakaiksi jakaumiksi.[17] Normaali­jakauma selvästikin on vakaa, mutta on olemassa muitakin vakaita jakaumia, esimerkiksi Cauchyn jakauma, jolla ei ole odotusarvoa eikä varianssia ja jota sen vuoksi ei sen enempää keskeinen raja-arvolause enempää kuin suurten lukujen lakikaan koske.

Skaalaus­tekijä bn saattaa olla verrannollinen lausekkeeseen nc, missä usein c = 1/2, mutta se voidaan myös kertoa jollakin n:n hitaasti vaihtelevalla funktiolla.[12][18]

Toistettujen logaritmien laki tarkentaa, mitä tapahtuu suurten lukujen lain ja keskeisen raja-arvolauseen "välissä". Erityisesti se osoittaa, että normalisointi­funktion avulla, joka suuruudeltaan on suurten lukujen laissa esiintyvän lukumäärän n ja keskeisessä raja-arvolauseessa esiintyvän neliöjuuren välissä, saadaan n:n kasvaessa ei-triviaaleja tuloksia.

Vaihtoehtoisia muotoiluja

[muokkaa | muokkaa wikitekstiä]

Tiheysfunktiot

[muokkaa | muokkaa wikitekstiä]

Kahden tai useamman riippumattoman muuttujan summan tiheysfunktio on näiden muuttujien tiheyksien konvoluutio, jos niillä on tiheys­funktiot. Niinä keskeinen raja-arvolauseen voidaan tulkita koskevan näiden tiheysfunktioiden ominaisuuksia konvoluutiossa: tiheys­funktio­joukon konvoluutio lähestyy normaalijakaumaa, kun tiheys­funktioiden lukumäärä kasvaa rajatta. Tällaiset tiheys­funktioiden suppenemista koskevat, niin sanotut lokaalit keskeiset raja-arvolauseet kuitenkin pätevät vain tietyin edellytyksin, jotka ovat ankarammat kuin keskeisen raja-arvolauseen edellä esitetyissä versiossa.[19]

Karakteristiset funktiot

[muokkaa | muokkaa wikitekstiä]

Koska konvoluution karakteristinen funktio on siinä mukana olevien tiheysfunktioiden karakterististen funktioiden tulo, keskeisestä raja-arvolauseesta on olemassa myös niitä koskeva muoto: tiheysfunktiojoukon karakterististen funktioiden tulo lähestyy normaalijakauman karakteristista funktiota, kun tiheysfunktioiden lukumäärä kasvaa rajatta, edellä mainituilla edellytyksillä. Tämän tarkentamiseksi on karakterististen funktioiden argumentteja on kuitenkin muunnettava sopivalla skaalaustekijällä.

Vastaava tulos voidaan esittää myös Fourier-muunnoksille, sillä karakteristinen funktio on oleellisesti Fourier-muunnos.

Lauseen laajennuksia

[muokkaa | muokkaa wikitekstiä]

Positiivisten satunnaismuuttujien tulo

[muokkaa | muokkaa wikitekstiä]

Lukujen tulon logaritmi on tulon tekijöiden logaritmien summa. Sen vuoksi sellaisten satunnais­muuttujien tulo, joista kukin lähestyy normaalijakaumaa mutta voi saada vain positiivisia arvoja, lähestyy log-normaalijakaumaa. Monet fysikaaliset suureet (erityisesti massa tai pituus, jotka eivät voi olla negatiivisia), ovat monien satunnaisten tekijöiden tuloja, jolloin nämä suureet monissa tilanteissa noudattavat log-normaalijakaumaa.

Sen sijaan että satunnaismuuttujien summaa koskeva keskeinen raja-arvolause edellyttää äärellistä varianssia, vastaava lause niiden tulolle edellyttää, että tiheysfunktioiden neliöt ovat integroituvia.[20]

Klassisen viitekehyksen ulkopuolella

[muokkaa | muokkaa wikitekstiä]

Asymptoottinen normaalisuus, toisin sanoen suppeneminen sopivien muunnosten ja uudelleenskaalausten jälkeen kohti normaalijakaumaa, on ilmiö, joka esiintyy monessa muussakin kuin edellä käsitellyissä tilanteissa, toisin sanoen satunnaismuuttujien tai -vektoreiden summan tapauksessa. Tilanteita, joissa vastaava ilmiö esiintyy, on aikaa myöten paljastunut jatkuvasti lisää, eikä niitä kaikkia toistaiseksi voida käsitellä yhtenäiseltä pohjalta.


Lakunaariset trigonometriset sarjat

[muokkaa | muokkaa wikitekstiä]

SaleminZygmundin lause. Olkoon U satunnaismuuttuja

joka on jakautunut tasaisesti välille (0, 2p), ja Xk = rk cos(nkU + ak), missä

  • nk toteuttaa lakunaarisuusehdon: on olemassa sellainen luku q > 1, että nk+1 = qnk kaikilla k:n arvoilla,
  • rk ovat sellaisia, että
  • 0 = ak < 2p.

Silloin[21][22]

konvergoi jakaumaltaan kohti normaalijaumaa N(0, 1/2).

Gaussin polytoopit

[muokkaa | muokkaa wikitekstiä]

Teoreema: Olkoot A1, ..., An riippumattomia satunnaisesti valittuja pisteitä tasossa , joista jokainen noudattaa kaksi­ulotteista standardi­normaali­jakaumaa. Olkoon Kn näiden pisteiden kupera peite ja ''Xn alueen Kn pinta-ala. Silloin[23]

suppenee jakaumana kohti normaali­jakaumaa N(0, 1), kun n kasvaa rajatta.

Sama pätee kaikissa ulottuvuuksissa (2, 3, ...).

Kuperaa polytooppia Kn sanotaan Gaussin satunnais­polytoopiksi.

Vastaava tulos pätee Gaussin polytooppien kärkien, särmien ja sivutahkojenkin lukumäärälle.[24]

Lause. Olkoot satunnaismuuttujat X1, X2, … ∈ L2(O) sellaisia, että Xn → 0 heikosti joukossa L2(O) ja Xn2 → 1 heikosti joukossa L1(O). Silloin on olemassa sellaiset kokonaisluvut n1 < n2 < …, että suppenee kohti jakaumaa N(0, 1), kun k kasvaa rajatta.[25]

Satunnaiskulku kidehilassa

[muokkaa | muokkaa wikitekstiä]

Keskeisestä raja-arvolauseesta on olemassa myös versio, joka koskee yksinkertaista satunnaiskulkua kidehilassa. Kidehilan oletetaan olevan ääretön Abelin verkko, joka peittää äärellisen verkon. Tätä tulosta on käytetty kiteiden rakenteiden kuvaamiseen.[26][27]

Sovelluksia ja esimerkkejä

[muokkaa | muokkaa wikitekstiä]

Yksinkertainen esimerkki

[muokkaa | muokkaa wikitekstiä]
Todennäköisyystiheysfunktioita silmälukujen summalle heitettäessä noppaa 1...5 kertaa. Heittokertojen lukumäärän n kasvaessa jakauma lähestyy keskeisen raja-arvolauseen mukaisesti muodoltaan normaali­jakaumaa. Oikeassa alakulmassa tiheysfunktioiden kuvaajat on skaalattu uudelleen ja sijoitettu päällekkäin, jolloin niitä voidaan helposti verrata normaalijakaumaan (musta käyrä).
Binomijakaumaan perustuva simulaatio. Valitaan useita kertoja satunnaisesti luku 0 tai 1, ja tulosten keskiarvo lasketaan, kun näin on tehty 1...512 kertaa. Voidaan nähdä, että kun otoskoko kasvaa, keskiarvojen jakauma kapenee ja tulee molemmissa ääripäissään matalaksi.

Yksinkertainen esimerkki keskeisestä raja-arvolauseesta saadaan heittämällä suurta määrää samanlaisia, "painottamattomia" noppia. Saatujen silmälukujen summa tai vaihtoehtoisesti keskiarvo noudattaa tällöin likimain normaali­jakaumaa. Koska reaalimaailman suureet ovat usein monien havaitsematta jääneiden satunnais­ilmiöiden painotettuja keskiarvoja, keskeinen raja-arvolause osaltaan myös selittää, miksi normaalijakauma esiintyy mitä erilaisimmissa ilmiöissä. Siihen perustuu myös normaali­jakauman käyttö likiarvona suuria otoksia koskevia kontrolloiduissa tilastollisissa kontrolloiduissa kokeissa.


Sovellettavuudesta yleisesti

[muokkaa | muokkaa wikitekstiä]

Julkaistussa kirjallisuudessa on suuri joukko käyttökelpoisia ja mielen­kiintoisia esimerkkejä keskeisen raja-arvolauseen sovelluksista.[28] Esimerkkeinä voidaan mainita seuraavat:[29]

  • Sen etäisyyden todennäköisyys­jakauma, johon satunnaiskulussa päädytään, lähestyy normaalijakaumaa.
  • Heitettäessä suurta määrää kolikkoja kruunien tai vastaavasti klaavojen lukumäärän todennäköisyys­jakauma lähestyy normaalijakaumaa.

Keskeistä raja-arvolauseesta seuraa, että mielivaltaisten riippumattomien satunnai­smuuttujien summa noudattaa likimain normaalijakaumaa, mikäli niitä yhteenlaskettavia muuttujia on hyvin paljon ja mikäli jokaisen yksityisen muuttujan vaihtelu on pieni verrattuna summan vaihteluun.[4]

Täten keskeinen raja-arvolause myös selittää "kellokäyrän" (Gaussin käyrän) yleisen esiintymisen reaali­maailman aineistoon sovelletuissa tietynlaisen tapauksen esiintyvyyden arvioinneissa. Sen kaltaisissa tapauksissa kuin esimerkiksi elektronisessa hälyssä, tutkintojen arvosanoissa ja monissa muissa voidaan yksittäistä mitattua arvoa usein pitää painotettuna keskiarvona suuresta määrästä pieniä ilmiöitä. Keskeisen raja-arvolauseen yleistysten avulla todetaan, että tämä usein, joskaan ei kaikissa tapauksissa, tuottaa lopullisen jakauman, joka on likipitäen normaali.

Regressioanalyysi

[muokkaa | muokkaa wikitekstiä]

Regressioanalyysi ja varsinkin tavallinen pienimpien neliösummien menetelmä osoittavat, että jos jokin muuttuja ei ole riippumaton, se yleensä riippuu jonkin funktion mukaisesti yhdestä tai useammasta riippu­mattomasta muuttujasta, joihin lisäksi liittyy korjaustermi. Useat regressioon perustuvat tilastolliset päätelmät edellyttävät, että korjaustermi on normaalisti jakautunut. Tämä oletus voidaan perustella olettamalla, että korjaustermi itse asiassa on hyvin monien riippumattomien korjaustermien summa; vaikka yksittäiset korjaustermit sinänsä eivät olisikaan normaalisti jakauteet, keskeisen raja-arvolauseen perusteella niiden summaa voidaan kuitenkin approksimoida normaalijakaumalla.

Käsityksen normaalijakauman luonteesta eräänlaisena monen tekijän yhteisvaikutusta kuvaavana rajajakaumana esitti eräissä erikoistapauksissa jo Abraham de Moivre[30] vuonna 1733.[31] Keksintö oli tuolloin pitkälti aikaansa edellä, ja se lähes unohdettiin, kunnes kuuluisa ranskalainen matemaatikko Pierre-Simon Laplace palasi asiaan vuonna 1812 julkaistussa teoksessa Théorie analytique des probabilités.[31] Laplace kuitenkin onnistui todistamaan lauseen vain binomijakauman tapauksessa.[30] Mutta myöskään Laplacen keksintö ei hänen omana aikanaan saanut paljonkaan huomiota. Vasta 1800-luvun lopulla keskeisen raja-arvolauseen merkitys alettiin yleisesti ymmärtää, ja vuonna 1901 venäläinen matemaatikko Aleksandr Ljapunov määritteli sen yleisin käsittein ja todisti täsmällisesti, miten se matemaattisesti toimii.[31] Nykyisin keskeinen raja-arvolause yhdessä suurten lukujen lain kanssa muodostaa perustan koko matemaattiselle tilastotieteelle.[32]

Francis Galton kuvaili keskeisen raja-arvolauseen merkitystä seuraavasti:[33]

»Tunnen tuskin mitään, mikä siinä määrin olisi omiaan kiehtomaan mielikuvitusta kuin se ihmeellinen kosminen järjestys, jonka "virheen frekvenssin laki" ilmaisee. Kreikkalaiset olisivat personifioineet lain ja pitäneet sitä jumalana, jos olisivat tunteneet sen. Se hallitsee tyynesti ja itse täysin syrjässä pysytellen keskellä villeintä sekaannusta. Mitä runsaampi väkijoukko ja mitä suurempi näennäinen sekasorto, sitä täydellisemmin se vallitsee. Se on Järjettömyyden ylin laki. Missä tahansa onkin käsillä suuri joukko kaoottisia alkeisvoimia, jotka ohjautuvat niiden suuruusluokkien mukaisessa järjestyksessä, odottamaton ja mitä kaunein säännöllisyyden muoto osoittautuu olleen piilevänä koko ajan.»

Termin "keskeinen raja-arvolause" (saks. zenrtaler Grenzwertsatz) otti ensimmäisenä käyttöön George Pólya vuonna 1920 erään tutkielmansa nimessä.[34][35] Pólya nimitti lausetta "keskeiseksi" sen suuren merkityksen vuoksi, joka sillä todennäköisyysteoriassa on. Le Camin mukaan todennäköisyyslaskennan ranskalainen koulukunta kuitenkin tulkitsee sanan "keskeinen" viittaavan siihen, että lause kuvaa jakauman keskikohdan, ei sen ääripäiden käyttäytymistä.[35] Pólyan vuonna 1920 julkaiseman tutkielman yhteenvedossa[34] sanotaan:

Gaussin todennäköisyystiheyden 1 = e-x² esiintyminen toistokokeissa ja mittausvirheissä, jotka saadaan yhteistuloksena hyvin monista ja hyvin pienistä virhelähteistä, sekä diffuusioprosesseissa ja niin edelleen voidaan tunnetusti selittää samalla raja-arvolauseella, jolla on keskeinen osa toden­näköisyys­laskennassa. Tämän raja-arvolauseen keksijäksi pitää nimetä Laplace; luultavaa on, että sen täsmällisen todistuksen esitti ensimmäisenä Tšebyšov, ja terävin löydettävissä oleva muoto, jonka tunnen, on eräässä Ljapunovin artikkelissa. [...]

Yleisimmässä muodossaan lauseen todisti suomalainen matemaatikko Lindeberg vuonna 1922. Saman tuloksen todisti myöhemmin Lindebergin todistuksesta tietämättä myös Alan Turing vuonna 1934. Vasta lähetettyään tutkielmansa Cambridgen yliopistoon tarkastettavaksi hän sai tietää, että se oli jo aiemmin todistettu, minkä vuoksi Turingin tutkielmaa ei koskaan julkaistu.[36][37]

Eräs Andreas Haldin laatima artikkeli matemaattisen tilasto­tieteen historiasta sisältää myös perusteellisen esityksen keskeisen raja-arvolauseen historiasta. Siinä kerrotaan yksityiskohtaisesti Laplacen sekä myös Cauchyn, Besselin ja Poissonin keksinnöistä.[38] Hans Fischer on laatinut asiasta kaksi historiallista esityistä, joista ensimmäinen kuvaa kehitystä Laplacesta Cauchyyn, jälkimmäinen von Misesin, Pólyan, Lindebergin, Lévyn ja Cramérin tutkimuksia 1920-luvulla.[39] Le Cam on kuvaillut kehitystä vuoden 1935 aikoihin.[35] Bernstein on myös laatinut lauseen historiasta esityksen, joka keskittyy Pafnuty Tšebyšovin ja hänen oppilaidensa Andrei Markovin ja Aleksandr Ljapunovin töihin, jotka johtivat keskeisen raja-arvolauseen ensimmäiseen yleisillä ehdoilla päteviin todistuksiin.[40]

Käännös suomeksi
Käännös suomeksi
Tämä artikkeli tai sen osa on käännetty tai siihen on haettu tietoja muunkielisen Wikipedian artikkelista.
Alkuperäinen artikkeli: en:Central limit theorem
  1. The Central Limit Theorem math.uah.edu. Viitattu 7.1.2015.
  2. Rice, John: Mathematical Statistics and Data Analysis, 2. painos. Duxbury Press, 1995. ISBN 0-534-20934-3
  3. Voit, Johannes: The Statistical Mechanics of Financial Markets, s. 124. Springer-Verlag, 2003. ISBN 3-540-00978-7
  4. a b Vasama, Pyry-Matti & Vartia, Yrjö: ”Keskeinen raja-arvolause”, Johdatus tilastotieteeseen, osa 1, s. 285-286. Gaudeamus, 1973. ISBN 951-662-015-9
  5. Billingsley, Patrick: Probability and Measure, 3. painos, s. 357. John Wiley & Sons, 1995. ISBN 0-471-00710-2
  6. Bauer, Heinz: ”Theorem 30.13”, Measure and Integration Theory, s. 199. Berliini: de Gruyter, 2001. ISBN 3110167190
  7. Billingsley, Patrick: Probability and Measure, 3. painos, s. 362. John Wiley & Sons, 1995. ISBN 0-471-00710-2
  8. a b Tuominen, Pekka & Norlamo, Pekka: ”Keskeinen raja-arvolause”, Todennäköisyyslaskenta, osa 2, s. 496–497. Limes ry, 1978. ISBN 951-745-023-0
  9. A. W. Van der Vaart: Asymptotic statistics. New York: Cambridge University Press, 1998. ISBN 978-0-521-49603-2
  10. Voit, Johannes: ”Section 5.4.3”, The Statistical Mechanics of Financial Markets (Texts and Monographs in Physics). Springer-Verlag, 2003. ISBN 3-540-00978-7 Teoksen verkkoversio.
  11. Gnedenko, B. V. & Kolmogorovul, A. N.: Limit distributions for sums of independent random variables. Cambridge: Addison-Wesley, 1954. Teoksen verkkoversio.
  12. a b Uchaikin, Vladimir V. & Zolotarev, V. M.: Chance and stability: stable distributions and their applications, s. 61–62. VSP, 1999. ISBN 90-6764-301-7
  13. Stein, Charles: A bound for the error in the normal approximation to the distribution of a sum of dependent random variables. Proceedings of the Sixth Berkeley Symposium on Mathematical Statistics and Probability, 1972, s. 583–602. MR:402873 Artikkelin verkkoversio.
  14. Chen, L. H. Y. & Coldstein, L. & Shao, Q. M.: Normal approximation by Stein's method. Springer, 2011. ISBN 978-3-642-15006-7
  15. Artstein, S. & Ball, K. & Barthe, F. & Naor, Assaf: Solution of Shannon's Problem on the Monotonicity of Entropy. Journal of the American Mathematical Society, 2004, 17. vsk, nro 4, s. 975–982. doi:10.1090/S0894-0347-04-00459-X Artikkelin verkkoversio.
  16. Set, Jeffrey: ”Theorem 5.3.4”, A first look at rigorous probability theory, s. 47. World Scientific, 2000. ISBN 981-02-4322-7
  17. Johnson, Oliver Thomas: Information theory and the central limit theorem, s. 88. Imperial College Press, 2004. ISBN 1-86094-473-6
  18. Borodin, A. N. & Ibragimov, Il'dar Abdulovich & Sudakov, V. N.: ”Theorem 1.1”, Limit theorems for functionals of random walks, s. 8. AMS Bookstore, 1995. ISBN 0-8218-0438-3
  19. Petrov, V. V.: ”7. luku”, Sums of Independent Random Variables. New York, Heidelberg: Springer-Verlag, 1976.
  20. Remala, G. & Wesolowski, G.: Asymptotics of products of sums and U-statistics. Electronic Communications in Probability, 2002, 7. vsk, s. 47–54. doi:10.1214/ecp.v7-1046 Artikkelin verkkoversio. (Arkistoitu – Internet Archive)
  21. Zygmund, Antoni: ”Sect. XVI.5, Theorem 5-5”, Trigonometric series, Volume II. (vuonna 2003 ilmestynyt yhdistelmä osista I ja II) Cambridge University Press, 1959. ISBN 0-521-89053-5
  22. Gaposhkin, V. F.: Lacunary series and independent functions. Russian Mathematical Surveys Vuosi = 1966, Määritä ajankohta! doi:10.1070/RM1966v021n06ABEH001196
  23. Bárány, Imre & Vu, Van: Central limit theorem for Gaussian polytopes (Theorem 1.1.). Annals of Probability, 2007, 35. vsk, nro 4. Institute of Mathematical Statistics. doi:10.1214/009117906000000791 arXiv:math/0610192
  24. Bárány, Imre & Vu, Van: Central limit theorem for Gaussian polytopes (Theorem 1.2.). Annals of Probability, 2007, 35. vsk, nro 4. Institute of Mathematical Statistics. doi:10.1214/009117906000000791 arXiv:math/0610192
  25. Gaposhkin, V. F.: Lacunary series and independent functions. Russian Mathematical Surveys Vuosi = 1966, Määritä ajankohta! doi:10.1070/RM1966v021n06ABEH001196
  26. Kotani, M. & Sunada, Toshikazu: Spectral geometry of crystal lattices, s. 271–305. Contemporary Math, 2003. ISBN 978-0-8218-4269-0
  27. Toshikazu Sunada: Topological Crystallography ---With a View Towards Discrete Geometric Analysis---. Springer, 2012. ISBN 978-4-431-54177-6
  28. Ivo Dinov & Nicolas Christou & Juana Sanchez: Central Limit Theorem: New SOCR Applet and Demonstration Activity. Journal of Statistics Education, 2008, 16. vsk, nro 2. ASA. Artikkelin verkkoversio. (Arkistoitu – Internet Archive)
  29. SOCR CLT Activity wiki.stat.ucla.edu. Viitattu 9.1.2016.
  30. a b Tuominen, Pekka & Norlamo, Pekka: ”Johdanto, katsaus historiaan”, Todennäköisyyslaskenta, osa 1, s. iv. Limes ry, 1978. ISBN 951-745-023-0
  31. a b c Tijms Henk: Understanding Probability: Chance Rules in Everyday Life, s. 169. Cambridge University Press, 2004. ISBN 0-521-54036-4
  32. Pekka Tuominen & Pekka Norlamo: ”Alkusanat”, Todennäköisyyslaskenta, osa 1. Limes ry, 1978. ISBN 951-745-023-0
  33. Galton, Francis: Natural Inheritance, s. 66. Määritä julkaisija! Teoksen verkkoversio. (Arkistoitu – Internet Archive)
  34. a b Pólya, George: Über den zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung und das Momentenproblem. Mathematische Zeitschrift, 1920, 8. vsk, nro 3–4, s. 171–181. doi:10.1007/BF01206525 Artikkelin verkkoversio. (saksaksi)
  35. a b c Lucien Le Cam: The central limit theorem around 1935. Statistical Science, 1986, 1. vsk, nro 1, s. 78–91. doi:10.2307/2245503 Artikkelin verkkoversio.
  36. Aldrich, John: England and Continental Probability in the Inter-War Years. Electronic Journ@l for History of Probability and Statistics, joulukuu 2009, 5/2. vsk. Artikkelin verkkoversio.
  37. S. L. Zabell: Symmetry and its discontents: essays on the history of inductive probability, s. 199–. Cambridge University Press, 2005. ISBN 0-521-44470-5
  38. A History of Mathematical Statistics from 1750 to 1930 (Ch. 17) Andreas Hald.
  39. Fischer, Hans: ”Luku 2: The Central Limit Theorem from Laplace to Cauchy: Changes in Stochastic Objectives and in Analytical Methods; Luku 5.2: The Central Limit Theorem in the Twenties”, A History of the Central Limit Theorem: From Classical to Modern Probability Theory. Sources and Studies in the History of Mathematics and Physical Sciences. Springer, 2001. doi:10.1007/978-0-387-87857-7 ISBN 978-0-387-87856-0
  40. Bernstein, Sergei Natanovich: ”P.L. Tšebyšovin töistä todennäköisyysteoriassa”, Nauchnoe Nasledie P.L.Chebysheva, Vypusk Pervyi: Matematika (P. L. Tšebyšovin tieteellinen perintö, 1. osa: Matematiikka), s. 174–. Moskova, Leningrad: Academiya Nayk SSSR, 1945. (venäjäksi)

Aiheesta muualla

[muokkaa | muokkaa wikitekstiä]