Hajontaluku

Wikipediasta
Siirry navigaatioon Siirry hakuun
Keskihajonta normaalijakauman tapauksessa: yhden keskihajonnan etäisyys keskiarvosta rajaa todennäköisyysmassasta 68,27 %, kahden keskihajonnan etäisyys 95,45 % ja kolmen keskihajonnan etäisyys 99,73 %.

Hajontaluku on tilastotieteessä todennäköisyysjakauman hajonnan eli sen satunnaismuuttujan vaihtelun mitta.[1] Yleisimpiä hajontalukuja ovat keskihajonta, varianssi, otoskeskihajonta, otosvarianssi, kvantiili ja variaatiokerroin. [2] Hajontaluvut ovat keskilukujen ohella keskeisimpiä jakaumiin liittyviä käsitteitä.[1]

Hajonnan mittaaminen

[muokkaa | muokkaa wikitekstiä]

Hajontaluku on reaaliluku, joka saa sitä suuremman arvon mitä enemmän vaihtelua jakauman satunnaismuuttujien arvoissa esiintyy. Yleensä tämä lasketaan mittaamalla havaittujen arvojen etäisyyttä havaintoarvojen odotus- tai keskiarvosta. Käytettävän hajontaluvun valinta riippuu käyttötarkoituksesta; eri hajontaluvut sopivat eri tilanteisiin riippuen, pyritäänkö tarkastelemaan jakauman absoluuttista vaiko suhteellista hajontaa. Jos otannassa ei ole vaihtelua, hajontaluku saa arvon nolla.[1]

Joskus hajontaa kuvattaessa käytetään mittauksen kohteen kanssa samaa yksikköä. Jos mittauksen kohteen yksikkö on esimerkiksi kilogramma, myös hajonnan yksikkönä käytetään kilogrammaa. Tällöin hajontalukua voi käyttää hajonnan absoluuttisten arvojen tarkasteluun. Tällaisia hajonnan mittoja ovat:

Yksiköttömät hajontaluvut kuvaavat suhteellista hajontaa satunnaismuuttujan odotusarvoon nähden. Usein nämä voidaan ilmaista prosentteina. Tällöin on mahdollista vertailla myös eri yksiköissä ilmaistujen jakaumien hajontoja. Yksiköttömiä hajontalukuja ovat:

Muita hajontalukuja ovat:

Yleisimmät hajontaluvut

[muokkaa | muokkaa wikitekstiä]
Pääartikkeli: Varianssi

Varianssi kuvaa, kuinka kaukana satunnaismuuttujan arvot ovat tyypillisesti sen odotusarvosta. Reaaliarvoisen satunnaismuuttujan varianssi on sen toinen keskimomentti. Varianssin neliöjuurta sanotaan keskihajonnaksi.

Diskreetin jakauman varianssi lasketaan kaavalla

, jossa X on satunnaismuuttuja ja μ on sen odotusarvo tai keskiarvo.[3]

Jatkuvan jakauman varianssi lasketaan kaavalla .[3][1]

Pääartikkeli: Keskihajonta

Satunnaismuuttujan standardipoikkeama eli keskihajonta kuvaa keskimääräistä poikkeamaa odotusarvosta. Keskihajonta on varianssin neliöjuuri: .[2][3] Etuna varianssiin nähden on tulkinnan helppous, sillä keskihajonnan asteikko vastaa mittausten asteikkoa.

Otosvarianssi

[muokkaa | muokkaa wikitekstiä]

Otosvarianssi on varianssi, joka lasketaan suuremman joukon osajoukosta. Kun n lukuarvon joukko on suuremman joukon Y osajoukko, tämän otosvarianssi on , missä on tutkittavan muuttujan y keskiarvo.[3]

Pääartikkeli: Otoshajonta

Otoksen keskihajonnan harhaton lähde? estimaatti eli otoshajonta on otosvarianssin neliöjuuri:

.[3]

Kvantiiliväli

[muokkaa | muokkaa wikitekstiä]

Kvantiilit ovat satunnaismuuttujan kertymäfunktiolta säännöllisin välein poimittuja prosenttipisteitä. Satunnaismuuttujan -kvantiili , , on luku, joka toteuttaa ehdot ja .[1]

Jakamalla todennäköisyysjakauman kertymäfunktio q kappaleeseen yhtä suuria joukkoja saadaan q-kvantiili. Osalle kvantiileista on vakiintuneet nimet: 100-kvantiilit ovat persentiilejä, 10-kvantiilit ovat desiilejä, 5-kvantiilit ovat kvintiilejä, ja 4-kvantiilit ovat kvartiileja. Kvantiilien avulla on mahdollista muodostaa kvantiiliväli, joka kuvaa todennäköisyyttä, jolla satunnaismuuttuja saa arvot kahden eri kvantiilin välillä.[1]

Variaatiokerroin

[muokkaa | muokkaa wikitekstiä]

Variaatiokerroin on hajontaluku, joka ei ole mittayksikköön sidottu. Variaatiokertoimen avulla on mahdollista vertailla kahden eri mitta-asteikolla mitatun jakauman hajontoja. Variaatiokerroin on määritelty keskihajonnan ja keskiarvon  osamääränä:

.[4][1]

Vaihteluväli

[muokkaa | muokkaa wikitekstiä]

Vaihteluväli on järjestys-, välimatka- ja suhdeasteikon muuttujille sopiva hajontaluku. Se kuvaa pienimmän ja suurimman muuttujan välin , joka lasketaan näiden arvojen erotuksena .[2][1]

Käyttötarkoituksia

[muokkaa | muokkaa wikitekstiä]

Hajonnan avulla on mahdollista saada kattavampi käsitys satunnaismuuttujan todennäköisimmistä arvoista. Esimerkiksi joukkojen ja lukuja arpomalla saadaan alkioiden arvojen yhtäsuuresta odotusarvosta huolimatta hyvin erilaisia tuloksia. Tunnettujen hajontalukujen avulla onkin mahdollista arvioida erilaisten tapahtumien todennäköisyyksiä, mikä on keskeistä muun muassa riskienhallinnassa.

Fysiikassa, kemiassa ja muissa mitattavissa luonnontieteissä mittaustulosten vaihtelua tarkastelemalla on mahdollista arvioida koetulosten luotettavuutta.

Biologiassa populaation ominaisuuksien määrittämisessä on keskeistä huomioida havaittujen ominaisuuksien vaihtelu.

Rahoitusmatematiikassa portfolion odotetun tuoton varianssi ja keskihajonta kuvaavat sijoitukseen kohdistuvaa riskiä. Mitä pienempi hajonta on, sitä todennäköisemmin sijoituksesta saatu tuotto vastaa sen odotusarvoa ja sitä houkuttelevampi sijoituskohde on.

Taloustieteessä, rahoituksessa ja muissa tieteissä hajontaa pyritään selittämään regressioanalyysillä, joka kuvaa muuttujan saamia arvoja suhteessa toiseen muuttujaan.[5]

  1. a b c d e f g h Milton, J.S., Arnold, J.C.: Introduction to Probability and Statistics. McGraw-Hill Inc., 1995.
  2. a b c Hajontaluvut Yhteiskuntatieteellinen tietoarkisto. 31.08.2003. Tampereen yliopisto. Viitattu 10.4.2015.
  3. a b c d e Ilkka Mellin: Tilastolliset menetelmät: Kaavat. TKK, 2006.
  4. Nummenmaa, Lauri: Käyttäytymistieteiden Tilastolliset Menetelmät.. Tammi, 2004. ISBN 951-26-5203-X.
  5. Alan O. Sykes: Introduction to Regression Analysis The Inaugural Coase Lecture. Arkistoitu 7.2.2015. Viitattu 10.04.2015.

Aiheesta muualla

[muokkaa | muokkaa wikitekstiä]