Hajonnan mittaaminen tilastoissa

16.8.2019
Hajonnan mittaamisella on tärkeä rooli missä tahansa datan asetelmissa. Nämä mittaukset kulkevat käsi kädessä keskeisten tendenssien mittaamisen kanssa ja ne osoittavat datan vaihtelevuuden. 

Hajonnan mittaaminen tilastoissa on ratkaisevaa, sillä se voi osoittaa tietyn näytteen tai ihmisyhmän sisällön. Kun on kyse näytteistä, hajonta on tärkeää, sillä se määrittelee virhemarginaalin jonka saamme tehdessämme päätelmiä keskeisten tendenssien, kuten keskiarvojen mittaamisessa.

Keskeisen tendenssin mittaaminen osoittaa eri tavat kerätä dataa. Tämä on hyvä menetelmä sen päättelemisessä kuinka eri muuttujat operoivat tietyissä näytteissä tai ihmisryhmissä. Ne kolme perusasiaa jotka ne osoittavat, ovat mediaani, keskiarvo ja alue.

Hajonnan mittaaminen kulkee käsi kädessä keskeisen tendenssin mittaamisen kanssa. Ne ovat oleellisia minkä tahansa datan lukemiseksi, sillä ne osoittavat kuinka vaihteleva data on. Niiden tärkeä rooli tilastoissa on Wildin ja Pfannkuchin (1999) vahvistamat.

Heidän mukaansa datan vaihtelevuuden havaintomme on yksi tilastollisen ajattelun peruskomponentti. Tapamme havaita vaihtelevuus antaa informaatiota hajonnasta, tai datan leviämisestä mediaanin ja keskiarvon suhteen.

Keskiarvo on todella yleinen tilastoissa. Mutta sitä on myös helppo tulkita väärin. Tämä tapahtuu etenkin silloin, kun muuttuvan tekijän arvoissa on laajaa hajontaa. Tässä hajonnan mittaaminen tulee mukaan peliin (2).

On olemassa kolme tärkeää komponenttia hajonnan mittaamisessa, joilla on suhde satunnaiseen vaihtelevuuteen (2):

  • Havainto siitä kuinka yleisiä ne ovat meitä ympäröivässä maailmassa.
  • Onko olemassa kilpailevia selityksiä.
  • Kyky ilmaista ne määrällisesti (joka tarkoittaa hajonnan käsitteen ymmärtämistä ja tietoa siitä kuinka sitä sovelletaan).
mies ja kaaviot

Mitä varten hajonnan mittaaminen on olemassa?

Hajonnan mittaaminen on tärkeää missä tahansa tilastollisessa tutkimuksessa, kun datasta yritetään saada johtopäätöksiä. Tämä johtuu siitä, että niillä on suora rooli työskentelemämme virhemarginaalin kanssa. Mitä suurempi hajonta näytteessä, sitä enemmän työskentelytilaa tässä marginaalissa. 

Ne voivat auttaa myös selvittämään onko data kaukana sen keskeisestä tendenssistä. Tämä osoittaa sen, onko keskeinen tendenssi hyvä tapa esittää ihmisiä, jotka ovat olleet näytteenä testissä. Tämä on todella hyödyllinen kun on kyse jakamisen vertaamisesta ja tiettyjen päätösten riskien ymmärtämisestä (1).

Lyhyesti sanottuna mitä suurempi hajonta, sitä vähemmän edustuksellinen keskeinen tendenssi on. Tässä on yleisimpiä hajonnan mittaamisen menetelmiä:

  • Alue
  • Keskipoikkeama
  • Vaihtelevuus
  • Keskihajonta
  • Kertoimen vaihtelu (tai suhteellinen keskihajonta)

Kuinka menetelmät toimivat

Alue

Alue on yleisesti paras ensimmäisten vertailujen tekemiseksi, sillä se tarkastelee vain kahta datan ääripäätä. Siksi se on yleisesti vain tekemisen arvoinen pienten näytepalojen kanssa (1). Alueen perusmääritelmä on: ero ensimmäisen ja viimeisen datan välillä.

omenat

Keskipoikkeama

Seuraavaksi on keskipoikkeama. Tämä on hyödyllinen, sillä se osoittaa missä data olisi, jos se olisi tarkalleen saman etäisyyden päästä keskiarvosta (1). Numeron poikkeama muuttujasta on ero tämän muuttujan absoluuttisesta arvosta ja keskiarvosta. Joten keskipoikkeama on periaatteessa vain kaikkien poikkeamien keskiarvo (3).

Vaihtelevuus

Vaihtelevuus on algebran toiminto kaikille arvoille, ja se on täydellinen päteville tilastoille (1). Vaihtelevuus on periaatteessa poikkeamien neliö.

Keskihajonta

Keskihajonta on kaikkein yleisin hajonnan mittaus mille tahansa näytteille, jotka on saatu samalta ihmisryhmältä (1). Se on vaihtelevuuden neliöjuuri (3).

Kertoimen vaihtelu

Tätä mittausta käytetään usein vaihtelun vertaamiseen kahden erillisen ryhmän datan välillä. Esimerkiksi jos saisimme tietoa koulun oppilaiden pituuksista ja painoista. Tämä voisi auttaa meitä päättelemään mitä tiettyjä jakaumia näkyy datan korkeimmassa ryhmittymässä, edustuksellisempaa mittausta varten.

hajonnan mittaaminen: tilastot

Kertoimen vaihtelu on yksi edustuksellisimmista hajonnan mittauksista joita olemme käsitelleet, sillä se antaa abstraktin luvun. Toisin sanoen se on ryhmämme muuttujista riippumaton. Tavallisesti näemme kertoimen vaihtelun prosenttilukuna (3).

Hajonnan mittaukset ovat tapoja nähdä kuinka paljon näytteessä on muuttujia. Ne kertovat myöskin kuinka edustuksellinen keskeinen tendenssi on. Jos muuttuja on alhainen, se tarkoittaa, että data on suhteellisen lähellä tätä tendenssiä ja se on hyvä kuvaus kokonaiselle datakokoelmalle.

Toisaalta, jos meillä on korkea muuttujien taso, se tarkoittaa, että data on levinnyt keskittymisen sijaan. Korkea vaihtelevuus tarkoittaa, että keskeinen tendenssi ei ole kovin edustuksellinen. Jos asian laita on tämä, meidän on kerättävä suuremmasta datan keskuksesta. Enemmän datan kerääminen laskee vaihtelevuutta, joka on perussyy laajalle virhemarginaalille.

  1. Graus, M. E. G. (2018). Estadística aplicada a la investigación educativa. Dilemas Contemporáneos: Educación, Política y Valores, 5(2).
  2. Batanero, C., González-Ruiz, I., del Mar López-Martín, M., & Miguel, J. (2015). La dispersión como elemento estructurador del currículo de estadística y probabilidad. Epsilon, 32(2), 7-20.
  3. Folgueras Russell, P. Medidas de Dispersión. Retrieved from https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=2&ved=2ahUKEwixgPLvw_XgAhVDAmMBHW02AesQFjABegQIBRAC&url=http%3A%2F%2Fwww.educaguia.com%2FBiblioteca%2Fapuntesde%2Fmatematicas%2FESTADISTICAYPROBABILIDAD%2FMEDIDASDEDISPERSION.pdf&usg=AOvVaw0DCZ9Ej1YvX7WNEu16m2oF
  4. Wild, C. J. y Pfannkuch, M. (1999). Statistical thinking in empirical enquiry. International
    Statistical Review, 67(3), 223-263.