Central Trend Measurements for Grouped Data
den foranstaltninger af central tendens til grupperede data de bruges i statistikker til at beskrive visse adfærd i en gruppe data, der leveres, f.eks. hvad de er tæt på, hvad er gennemsnittet af de indsamlede data, blandt andre.
Når en stor mængde data er taget, er det nyttigt at gruppere dem for at få en bedre orden af dem og dermed kunne beregne visse foranstaltninger med central tendens.
Blandt de centrale tendenser, der er mest anvendte, er det aritmetiske middel, medianen og tilstanden. Disse tal fortæller visse kvaliteter om de indsamlede data i et bestemt eksperiment.
For at bruge disse foranstaltninger er det først nødvendigt at vide, hvordan man grupperer et sæt data.
Grupperede data
For at gruppere data først skal du beregne datalængden, som opnås ved at subtrahere den højeste værdi minus den laveste værdi af dataene.
Vælg derefter et tal "k", hvilket er antallet af klasser, hvor du vil gruppere dataene.
Vi fortsætter med at opdele afstanden mellem "k" for at opnå amplitude af de klasser, der skal grupperes. Dette tal er C = R / k.
Endelig startes grupperingen, for hvilket der vælges et mindre antal end den mindste værdi af de opnåede data..
Dette nummer er den nederste grænse for første klasse. Til dette tilføjes C. Den opnåede værdi er den øvre grænse for første klasse.
Derefter tilføjes C til denne værdi, og den øvre grænse af den anden klasse opnås. På denne måde fortsætter du, indtil du får den øverste grænse for den sidste klasse.
Når dataene er grupperet, kan du fortsætte med at beregne middel, median og mode.
For at illustrere, hvordan det aritmetiske middel, median og mode beregnes, vil vi fortsætte med et eksempel.
eksempel
Derfor, når du grupperer dataene, får du en tabel som følgende:
De tre vigtigste centrale tendensstiltag
Nu skal vi fortsætte med at beregne det aritmetiske gennemsnit, medianen og tilstanden. Ovennævnte eksempel vil blive brugt til at illustrere denne procedure.
1- Aritmetisk middelværdi
Det aritmetiske middel består af at gange hver frekvens med gennemsnittet af intervallet. Derefter tilføjes alle disse resultater og til sidst divideres med de samlede data.
Ved hjælp af det foregående eksempel kunne vi konstatere, at det aritmetiske gennemsnit er lig med:
(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5,11111
Dette indikerer, at gennemsnitsværdien af dataene i tabellen er 5,11111.
2- Medium
For at beregne medianen af et datasæt er først alle data bestilt fra mindst til største. To sager kan præsenteres:
- Hvis datanummeret er ulige, er medianen de data, der ligger lige i midten.
- Hvis datanummeret er ens, er medianen gennemsnittet af de to data, der er tilbage i midten.
Når det kommer til grupperede data, udføres beregningen af medianen på følgende måde:
- N / 2 beregnes, hvor N er de samlede data.
- Det første interval søges, hvor den akkumulerede frekvens (summen af frekvenserne) er større end N / 2, og den nedre grænse for dette interval kaldes Li, er valgt..
Medianen er givet ved følgende formel:
Me = Li + (Ls-Li) * (N / 2 - Akkumuleret Frekvens før Li) / Frekvens af [Li, Ls)
Ls er den øvre grænse for området nævnt ovenfor.
Hvis ovenstående datatabel anvendes, har vi N / 2 = 18/2 = 9. De akkumulerede frekvenser er 4, 8, 14 og 18 (en for hver række af tabellen).
Derfor bør det tredje interval vælges, da den akkumulerede frekvens er større end N / 2 = 9.
Så Li = 5 og Ls = 7. Ved anvendelse af formlen beskrevet ovenfor skal du:
Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.
3- Mode
Mode er den værdi, der har mest frekvens blandt alle grupperede data; det vil sige den værdi, der gentages mest gange i det oprindelige datasæt.
Når du har en meget stor mængde data, bruges følgende formel til at beregne tilstanden for de grupperede data:
Mo = Li + (Ls-Li) * (Li-frekvens - Frekvens af L (i-1)) / ((Li-frekvensfrekvens for L (i-1)) + jeg + 1)))
Intervallet [Li, Ls) er det interval, hvor den højeste frekvens er fundet. For eksemplet lavet i denne artikel har vi den måde, der gives af:
Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.
En anden formel, der bruges til at opnå en omtrentlig værdi til mode, er følgende:
Mo = Li + (Ls-Li) * (frekvens L (i + 1)) / (frekvens L (i-1) + frekvens L (i + 1)).
Med denne formel er regnskabet følgende:
Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
referencer
- Bellhouse, D. R. (2011). Abraham De Moivre: Indstilling af scenen for klassisk sandsynlighed og dens applikationer. CRC Tryk.
- Cifuentes, J. F. (2002). Introduktion til sandsynlighedsteori. Univ. National of Colombia.
- Daston, L. (1995). Klassisk sandsynlighed i oplysningen. Princeton University Press.
- Larson, H.J. (1978). Introduktion til sandsynlighedsteori og statistisk indledning. Editorial Limusa.
- Martel, P.J. & Vegas, F.J. (1996). Sandsynlighed og matematisk statistik: Anvendelser i klinisk praksis og sundhedsstyring. Ediciones Díaz de Santos.
- Vázquez, A. L., & Ortiz, F.J. (2005). Statistiske metoder til måling, beskrivelse og styring af variabilitet. Ed. Universitetet i Cantabria.
- Vázquez, S. G. (2009). Matematikmanual for adgang til universitetet. Redaktionscenter for studier Ramon Areces SA.