Kirjeldav statistika: materjalid, andmete esitamine, järeldav statistika, näited

Tegelikult on kahte tüüpi statistikat, nimelt järeldavat statistikat ja kirjeldavat statistikat.

Kuid sel korral arutame üksikasjalikumalt ainult kirjeldavat statistikat.

Kas teate, mis statistika on, enne kui kirjeldavasse süveneda?

Kui te ei tea, mis statistika on, ole nüüd Mõistame kõigepealt statistika tähendust. Siin on rohkem teavet.

Sisukord

Statistika mõistmine

Statistika on spetsiaalne teadus, mille abil saate teada, kuidas andmeid koguda, andmeid esitada, andmeid analüüsida ja neid tõlgendada.

instagram viewer

Statistika töötab üldiselt arvandmete abil, mis on saadud nii loenduste kui ka tulemuste tulemustest mõõtmine, kasutades kriteeriumi järgi klassifitseeritud kategoorilisi andmeid teatud.

Seejärel registreeritakse ja kogutakse teavet nii arvandmete kui ka kategoorilise teabe kujul, millele viidatakse kui vaatlusele.

Arutelu suuna põhjal võib statistika jagada kahte tüüpi, sealhulgas:

1. Matemaatiline statistika (matemaatiline statistika)

Matemaatiline statistika või seda nimetatakse tavaliselt ka teoreetiline statistika on rakendus, mis on rohkem orienteeritud arusaamisele või modelleerimisele ja mitmesugustele statistilistele tehnikatele matemaatiliselt või teoreetiliselt.

2. Rakendusstatistika (rakendatud statistika)

Vahepeal keskendub rakendusstatistika pigem arutelule kui ka kontseptsiooni intuitiivsele mõistmisele. Nagu ka erinevad statistilised võtted, selle kasutamine erinevates teadusvaldkondades.

Statistiline meetod

Statistiline meetod ise on protseduur, mida tavaliselt kasutatakse andmete kogumisel, esitamisel, analüüsimisel ja tõlgendamisel.

Seejärel rühmitatakse ülaltoodud erinevad meetodid kahte suurde rühma, sealhulgas:

  1. Kirjeldav statistika
  2. Järeldatav statistika

Nagu varem selgitatud, käsitleme selles artiklis ainult järeldavat statistikat.

Mida mõeldakse kirjeldava statistika all? Lisateabe saamiseks lugege seda artiklit lõpuni.

Kirjeldav statistika

Kirjeldav statistika on meetod, mis tegeleb andmete kogumise või esitamisega kasuliku teabe saamiseks.

Statistika liigitatakse kaheks osaks, nimelt kirjeldavaks statistikaks ja järeldavaks statistikaks, mis viiakse läbi tehtud tegevuste põhjal.

Näiteks kirjeldav statistika ise hõlmavad:

  • tabel
  • skeem
  • diagramm
  • muud kogused ajakirjades ja ajalehtedes.

Mis puutub visuaalsesse näiteks, siis saame veebisaidi visuaalse näitena kasutada veebisaidi külastajate graafikut kirjeldav statistika, see on:

veebisaidi külastajate graafik

Kirjeldava statistika abil saab erinevaid andmekogumeid esitada lühidalt ja kenasti ning need suudavad pakkuda põhiteavet olemasolevatest andmekogumitest.

Sellest kirjeldavast statistikast saadud teave hõlmab andmete kontsentratsiooni suurust, leviku suurust ja ka andmekogumi suundumust. Lisateavet jätkatakse allpool.

Vormi andmete esitamine Graafiline teiste hulgas:

  • histogramm
  • Sektordiagramm
  • Ogive
  • Hulknurk
  • Tüve ja lehtede skeem

Andmete esitamine numbriline Sellel on mitu vormi, sealhulgas:

  • Kesktrend
  • Habras
  • Viltusus
  • Mõõdulint
  • Hajumine või hajumine

Kirjeldavate statistiliste andmete esitamine

Andmeid esitatakse kirjeldavas kategoorias graafiliselt ja numbriliselt, sealhulgas:

1. Andmete esitamine graafilises vormis

Andmete esitamine graafilises vormis koosneb mitmest liigist, sealhulgas:

  • Esiteks histogramm:

Histogramm on muutuja sagedusjaotuse graafik.

Histogrammikuva on tavaliselt plokkidena. Nende andmete esitamine koosneb kahest põhiteljest, mille nurk on 900 X-telje abstsissina ja Y-ordinaadina.

Kiire laius näitab kaugust intervalliklasside piirist, samas kui kiire kõrgus näitab andmete sagedust.

kirjeldav statistika pdf
  • Teiseks, Pirukas Diagramm:

Sektordiagramm või indoneesia keeles nimetatakse koogiskeemiks on ring, mis on jagatud mitmeks sektoriks.

Igas sektoris saab märkida iga rühma protsendi suuruse või osakaalu.

kirjeldav statistika
  • Kolmandaks Hulknurk:

Hulknurk on muutujale kuuluva sagedusjaotuse graafik.

Hulknurga välimus on tavaliselt ka katkiste joontena, mis on saadud tippude ühendamisel iga klassi keskmise väärtusega.

Seda hulknurka kasutatakse väga hästi kahe jaotuse kuju võrdlemisel.

kirjeldav ja järeldav
  • Neljandaks Ogive:

Ogive on muutuja kumulatiivse sagedusjaotuse kujutisvorm. Sageduse jaotustabeli jaoks saame teha ka positiivseid ja negatiivseid.

Ogive
  • Viiendaks Lehetüve diagramm (Vars ja leht):

Tüve- ja lehediagrammid, mida nimetatakse ka varre- ja lehekaartideks, on samad mis histogrammid, ainult et erinevus on selles, et saadud teave on parem.

Seda seetõttu, et tüvelehe diagramm näitab algsete vaatluste väärtusi.

Selles skeemis kirjeldatakse ka numbreid - numbritele, mis on samuti ribadena ja paremale, kirjutatakse ülejäänud arvud.

Lehetüve diagramm

2. Andmete arvuline esitamine

Nagu eespool mainitud, koosneb arvandmete esitlus mitut tüüpi, näiteks:

Numbriliste andmete esitamine koosneb mitut liiki, nimelt:

  • Esiteks, kesksed trendid.
  • Teiseks, hajumine või hajumine.
  • Kolmandaks habras.
  • Neljandaks, viltu.
  • Viiendaks - sihvuse mõõtmine.

Põhimeetod kirjeldavas statistikas

Kirjeldavas statistikas on kaks põhimeetodit, nimelt numbriline ja graafiline.

  • Numbriline lähenemine saab kasutada statistiliste väärtuste arvutamiseks andmete kogumi põhjal.
    Näitena: tähendabja standardhälve.
    See statistika annab teavet keskmise kohta ja üksikasjalikku teavet andmete levitamise kohta.
  • Graafiline meetod arvusmeetodist sobivam andmete teatud mustrite tuvastamiseks, teisest küljest on arvuline lähenemine täpsem ja objektiivsem.
    Nii täiendavad arvulised ja graafilised lähenemised üksteist. Seetõttu on väga tark, kui kasutame mõlemat meetodit üheaegselt.

Ühel muutujal on kolm peamist omadust või omadust, sealhulgas:

  • Andmete jaotus (sageduse jaotus)
  • Kontsentratsiooni või keskse kalduvuse mõõt (Keskne tendents)
  • Leviku suurus (Hajumine)

Andmete levitamine

Andmete korrastamine, korrastamine ja kokkuvõtete tegemine tabelite loomise kaudu on sageli abiks, eriti kui töötame suure hulga andmete käsitlemisel.

Tabel sisaldab loendit andmeväärtustest, mis võivad erineda (nii üksikud kui ka rühmitatud andmed), samuti nende sageduse väärtustest.

Sagedus kirjeldab andmete kategooriate esinemiste või esinemiste arvu.

Korrastatud andmete levitamist nimetatakse sageli sageduse jaotumine. Seega võib sageduse jaotust tõlgendada kui andmete jaotuste loendit (kas üksikud andmed või rühma andmed), millele järgneb sageduse väärtus.

Seejärel rühmitatakse andmed mitmesse klassi, et andmete olulised omadused või omadused oleksid kiiresti nähtavad.

Lihtsaim sagedusjaotus on jaotus, mis näitab muutuja iga väärtuse loetelu, millele on lisatud selle sageduse väärtus.

Sageduse jaotumine me saame seda näidata muul viisil kahel viisil tabel või koos diagramm.

Jaotusi saab kirjeldada ka protsentväärtuste abil. Jaotuse esitamine graafiku kujul hõlbustab andmekogumi teatud omaduste ja tendentside näitamist.

Kvantitatiivsed andmegraafikud hõlmavad histogramme, sageduse polügone ja muud.

Kvalitatiivsete andmete graafikud hõlmavad tulbakaarte, pirukakaarte ja teisi.

Sageduse jaotus hõlbustab meil andmete mustrite nägemist.

Kuid me kaotame teabe üksikute väärtuste kohta.

Levitamisvorm

Üks oluline asi, mis on muutuja "kirjeldus", on selle jaotuse kuju, mis kirjeldab muutuja väärtuste erinevate intervallide sagedust.

Üldiselt huvitab teadlast, kui hästi saab jaotust hinnata normaaljaotuse abil.

Lihtne kirjeldav statistika võib anda selle probleemiga seotud teavet.

Näiteks kui andmejaotuse sümmeetriat mõõtev viltus ei ole võrdne 0-ga, siis öeldakse, et jaotus on asümmeetriline (sümmeetriline),.

Ja kui viltu on 0, tähendab see, et andmed jaotuvad tavaliselt (sümmeetriliselt).

Kui andmejaotuse teravust mõõtev kurtoos ei ole võrdne 0-ga, siis võib andmete jaotus olla tavalisest jaotusest tasasem või teravam.

Normaaljaotuse kurtoosi väärtus on 0.

Täpsema teabe saame ühe normaalsuse testi abil, nimelt selle tõenäosuse kindlaksmääramiseks, kas Valim on saadud normaaljaotuse või mittejaotatud populatsiooni vaatluste põhjal (näiteks Kolmogorovi-Smirnovi test või test). Shapiro-Wilks'W).

Kuid ametlike testide hulgas ei saa ükski täielikult asendada andmete visuaalset kontrollimist graafiliste meetodite abil. Näiteks histogramm (graafik, mis kujutab muutuja sageduse jaotust).

Graafikud (näiteks histogrammid) võimaldavad meil hinnata empiirilise jaotuse normaalsust.

Seda seetõttu, et histogrammile järgneb normaalse kõvera ülekate.

See võimaldab meil ka kvalitatiivselt uurida andmete levitamise kuju erinevaid aspekte.

Näiteks võib jaotus olla bimodaalne (sellel on 2 piiki) või multimodaalne (rohkem kui 2 piiki).

See illustreerib, et valim ei ole homogeenne ja elemendid pärinevad kahest erinevast populatsioonist.

Kontsentratsiooni suurus (keskne tendents)

Üks olulisemaid aspekte andmete leviku näitamisel on vaatluskeskuse väärtus.

Igas aritmeetilises mõõtmises, mis on suunatud andmekogumi keskmist väärtust või keskset väärtust (vaatluste kogumit) näitama, nimetatakse tsentraalse tendentsi mõõt.

Sageli kasutatakse kolme tüüpi keskset suundumust:

  1. tähendab
  2. mediaan
  3. Režiim

Keskmine arv või ka helistatud aritmeetiline keskmine või mida me sageli nimetame tähendab üksi on kõige sagedamini kasutatav meetod keskse tendentsi mõõtmiseks.

Selle keskmise arvutamiseks liidetakse kõik vaadeldud andmete väärtused ja jagatakse seejärel andmete arvuga. Keskmist mõjutab äärmuslike väärtuste olemasolu.

mediaan on väärtus, mis jagab vaatluste kogumi kaheks võrdseks osaks või 50% vaatlustest, mis jäävad alla mediaani ja 50% on üle mediaani.

mediaan alates n mõõtmine / vaatlus x1, x2 ,…, Xn on vaatlusväärtus, mis asub pärast andmete sorteerimist andmeklastri keskel.

Kui vaatluste arv (n) on veider, mediaan asub otse andmeklastri keskel, kui aga n isegi mediaan saadakse interpoleerimise teel.

Nii jääb kahe andmekogumi keskmine andmekogumi keskele.

Mediaani ei mõjuta äärmuslike väärtuste olemasolu.

Režiim on kõige sagedamini esinevad või esinevad andmed.

Režiimi olemasolu kindlakstegemiseks peame kõigepealt korraldama andmed kasvavas järjekorras või vastupidi. Seejärel järgneb sageduse arvutamine.

Suurima sagedusega (sageli ilmuvat) väärtust nimetatakse režiimiks.

Režiimi kasutatakse nii arvuliste kui ka kategooriliste andmetüüpide jaoks.

Režiimi ei mõjuta äärmuslike väärtuste olemasolu.

Olulised omadused keskuse hea suuruse jaoks

Keskväärtuse (keskmise) mõõt on andmete jaotuse tüüpiline väärtus, seega peavad sellel olema järgmised omadused:

  • Peab arvestama kõigi andmekogumitega
  • Äärmuslikud väärtused ei tohiks neid mõjutada.
  • Peab olema proovist prooviks stabiilne.
  • Peab olema võimalik kasutada edasiseks statistiliseks analüüsiks.

Mitmest keskväärtusest lähtuvalt täidab keskmine peaaegu kõik need nõuded, välja arvatud tingimusel, et teises punktis mõjutavad keskmist äärmuslikud väärtused.

Näiteks kui üksus on 2; 4; 5; 6; 6; 6; 7; 7; 8; 9, siis keskmine, mediaan ja ka režiim on kõik võrdsed 6-ga.

Kui viimane väärtus oleks 90 asemel 9, oleks keskmine 14,10.

Vahepeal mediaan ja režiim ei muutu.

Kuigi nii mediaan kui ka režiim on selles osas paremad, ei vasta need teistele nõuetele.

Seega tähendab on parima keskväärtuse näitaja ja seda kasutatakse sageli statistilise analüüsi valdkonnas.

Millal kasutame erinevaid keskväärtusi?

Sobiv keskuse suuruse väärtus sõltub andmete olemusest, sagedusjaotuse olemusest ja eesmärgist.

Kui andmed on kvalitatiivsed, saab kasutada ainult režiimi.

Näiteks kui meid huvitab asukohas tüüpilise mullatüübi tundmine või piirkonna kärpimismustrid, saame seda režiimi kasutada.

Kuid teisest küljest, kui andmed on kvantitatiivsed, võime kasutada ühte kesksete väärtuste mõõtjatest.

Kui andmed on kvantitatiivsed, siis peame arvestama andmeklastri sagedusjaotuse olemusega.

  • Kui andmete sagedusjaotus on ebanormaalne (mitte sümmeetriline), on keskpunktiks sobiv mediaan või režiim.
  • Kui on äärmuslikke väärtusi, olgu need väikesed või suured, on sobivam kasutada mediaani või režiimi.
  • Kui andmete jaotus on normaalne (sümmeetriline), saab kasutada kõiki keskväärtuse mõõtmeid, olgu see siis keskmine, mediaan või režiim.
    Keskmist kasutatakse siiski sagedamini kui teisi, kuna see vastab hea keskmõõdu nõuetele.
  • Kui tegeleme kiiruse, kiiruse ja hinnaga, on sobivam kasutada harmoonilist keskmist.

Kui meid huvitavad suhtelised muutused, näiteks bakterite kasvu, rakkude jagunemise jms puhul, on geomeetriline keskmine kõige sobivam keskmine.

Järeldatav statistika

Järeldatav statistika on meetod, mida saab kasutada väikeste vanemandmete rühmade ja populatsioonist võetud proovide analüüsimiseks. Kuni prognoosimisel ja saab teha järeldusi ka vanemate andmegrupi või populatsiooni kohta.

Järeldatav statistika on kõigi meetodite või meetodite kokkuvõte, mis on seotud mõningate andmete analüüsimisega. Mis jõuab siis kogu elanikkonna vanemandmete prognoosimise või järelduste tegemiseni.

Järeldatava statistikaga seotud üldistustel on ebakindlad omadused.

Seda seetõttu, et see põhineb osalistel andmetel, mis on saadud mõningatest andmetest, nii et saadud on ainult prognoos.

Järeldatava statistika näide

Viimase viie aasta jooksul tehtud lõpetamiste arvestuses. dKeskkoolis näitab see, et umbes 72% keskkooliõpilastest lõpetab rahuldava hindega.

Arvuline väärtus 72% on kirjeldava statistika vorm.

Kui see põhineb sellel, võib õpilane järeldada, et võimalus, et ta läbib, on väga rahuldava skooriga.

See väärtus on üle 70%. Nii et õpilane on teinud järelduslikku statistikat, millel on muidugi ebakindel olemus.

Järeldatava statistika piltide näide

järeldav statistika materjal

Järeldatavas statistikas viiakse läbi parameetrite hindamine, mis käivitab hüpoteeside tekke.

Ja ka hüpoteesi testimine, et jõuda üldiselt kehtivate järeldusteni.

Seda meetodit või meetodit nimetatakse tavaliselt induktiivne statistika. Seda nimetatakse seetõttu, et tehtud järeldused põhinevad ainult osa andmetest saadud teabel.

See järelduslik statistiline järeldus põhineb samuti ainult osal andmetest, mis võib põhjustada nende olemuse ebakindluse.

Nii et see lubab vigu otsuste tegemisel. Niisiis on erinevate järeldatavate statistiliste meetodite läbiviimisel hädavajalikud teadmised tõenäosusteooriast.

Järeldatavad statistilised funktsioonid

Järeldatav statistika või nimetatud ka induktiivstatistika on statistika, mille eesmärk on üldkogumit hinnata valimi tulemuste abil.

See hõlmab nii teoreetilist hindamist kui ka teoreetilist testimist. Järeldavat statistikat kasutatakse tavaliselt mitme asja tegemiseks, näiteks järgmiseks:

  1. Tehke üldistused valimist populatsioonini.
  2. Viia läbi hüpoteeside testimine.

Järeldatava statistika arutelu ulatus

Arutelu ulatuse põhjal võib järeldav statistika hõlmata järgmist:

  1. Tõenäosuse või tõenäosusteooria
  2. Teoreetiline jaotus
  3. Kovariantsuse analüüs
  4. Proovide võtmine ja jaotamine
  5. Rahvaarvu hinnang või rahvastikuteooria
  6. Dispersioonanalüüs
  7. Hüpoteesi testimine
  8. Korrelatsioonanalüüs ja olulisuse test
  9. Regressioonanalüüs prognoosimiseks

Kirjeldava statistika ja järeldava statistika erinevus

Ka järeldaval statistikal ja kirjeldaval statistikal on kindlasti erinevusi, siin toome muu hulgas nende kahe erinevused:

  1. Kirjeldav statistika on ainult piiratud andmete esitamisel tabelite, diagrammide, graafikute ja muude suuruste kujul.
  2. Kuigi järeldav statistika ei hõlma ainult kirjeldavat statistikat, vaid seda saab kasutada ka valimi populatsiooni hindamisel ja sellest järelduste tegemisel.
    Järeldatavate statistiliste järelduste tegemiseks tuleb läbida mitu hüpoteesi testimise etappi ja ka statistilised testid.
Loe ka: Järeldatav statistika

Seega lühike ülevaade kirjeldavast statistikast, mida saame edastada. Loodetavasti saab ülaltoodud kirjeldava statistika ülevaadet kasutada õppematerjalina.