Klassemærke for hvad det tjener, hvordan det tages og eksempler



den klasse mærke, også kendt som midtpunktet, er den værdi, der findes i midten af ​​en klasse, der repræsenterer alle værdier er i denne kategori. Grundlæggende er classmark anvendt til beregning af visse parametre såsom gennemsnit eller standardafvigelse.

Derefter er klassemærket midtpunktet for et hvilket som helst interval. Denne værdi er også meget nyttig for at finde variansen af ​​et sæt data, der allerede er grupperet i klasser, hvilket igen gør det muligt for os at forstå, hvor langt fra midten disse fundne data finder.

indeks

  • 1 Frekvensfordeling
    • 1.1 Hvor mange klasser skal overvejes?
  • 2 Hvordan får du det??
    • 2.1 Eksempel
  • 3 Hvad er det for??
    • 3.1 Eksempel
  • 4 referencer

Frekvensfordeling

For at forstå, hvad et mærke klasser er, er begrebet frekvensfordeling nødvendig. Givet et datasæt er en frekvensfordeling en tabel, der deler sådanne data i en række kategorier, der kaldes klasser.

Denne tabel viser, hvad der er antallet af elementer, der tilhører hver klasse; sidstnævnte er kendt som frekvens.

I denne tabel deles en del af de oplysninger, vi får fra dataene, fordi vi i stedet for at have den enkelte værdi af hvert element kun ved, at det tilhører klassen.

På den anden side får vi en bedre forståelse af datasættet, da det på denne måde er lettere at sætte pris på etablerede mønstre, hvilket letter manipulationen af ​​dataene..

Hvor mange klasser at overveje?

For at lave en frekvensfordeling skal vi først bestemme antallet af klasser, vi ønsker at tage, og vælge klassens grænser.

Valget af hvor mange klasser at tage skal være hensigtsmæssigt under hensyntagen til, at et lille antal klasser kan skjule oplysninger om de data, vi ønsker at studere, og en meget stor kan generere for mange detaljer, der ikke nødvendigvis er nyttige.

De faktorer, som vi skal tage hensyn til ved valg af, hvor mange klasser der skal tages, er flere, men blandt disse to skiller sig ud: den første er at tage højde for, hvor meget data vi skal overveje; den anden er at vide, hvilken størrelse distributionsområdet er (det vil sige forskellen mellem den største og den mindste observation).

Efter at have de klasser, der allerede er defineret, fortsætter vi med at tælle, hvor meget data der findes i hver klasse. Dette tal kaldes klassefrekvens og betegnes med fi.

Som vi tidligere har sagt, har vi, at en frekvensfordeling mister de oplysninger, der kommer individuelt fra hver data eller observation. Derfor søges der en værdi, der repræsenterer hele klassen som den tilhører; denne værdi er klassenes mærke.

Hvordan får du det??

Klassemærket er den centrale værdi, som en klasse repræsenterer. Det opnås ved at tilføje grænserne for intervallet og dividere denne værdi med to. Dette kunne vi udtrykke matematisk som følger:

xjeg= (Nedre grænse + Øvre grænse) / 2.

I dette udtryk xjeg betegner ith klassens mærke.

eksempel

Giv det følgende datasæt, giv en repræsentativ frekvensfordeling og få det tilsvarende klassemærke.

Da data i større numerisk værdi 391, og den laveste er 221, har vi området er 391 -221 = 170.

Vi vælger 5 klasser, alle med samme størrelse. En måde at vælge klasserne på er som følger:

Bemærk at hver data er i en klasse, de er uensartede og har samme værdi. En anden måde at vælge klasserne på er at overveje dataene som en del af en kontinuerlig variabel, som kunne nå nogen reel værdi. I dette tilfælde kan vi overveje klasser af formularen:

205-245, 245-285, 285-325, 325-365, 365-405

Denne måde at gruppere data på kan dog fremvise visse tvetydigheder med grænser. For eksempel i tilfælde af 245 opstår spørgsmålet: Hvilken klasse tilhører den til den første eller den anden??

For at undgå disse forvirringer foretages en konvention af ekstreme punkter. På denne måde vil første klasse være intervallet (205.245), det andet (245.285) og så videre.

Når klasserne er defineret, fortsætter vi med at beregne frekvensen, og vi har følgende tabel:

Efter at have opnået frekvensfordelingen af ​​dataene, fortsætter vi med at finde klassemærkerne for hvert interval. I virkeligheden skal vi:

x1= (205+ 245) / 2 = 225

x2= (245 + 285) / 2 = 265          

x3= (285 + 325) / 2 = 305

x4= (325+ 365) / 2 = 345

x5= (365 + 405) / 2 = 385

Vi kan repræsentere dette ved hjælp af følgende grafik:

Hvad er det for??

Som tidligere nævnt er klassemærket meget funktionelt for at finde det aritmetiske gennemsnit og variansen af ​​en gruppe data, der allerede er grupperet i forskellige klasser.

Vi kan definere det aritmetiske gennemsnit som summen af ​​observationer opnået mellem prøvestørrelsen. Fra et fysisk synspunkt er dets fortolkning ligevægtspunktet for et datasæt.

At identificere et helt sæt data med et enkelt tal kan være risikabelt, så vi skal også tage hensyn til forskellen mellem dette ligevægtspunkt og de reelle data. Disse værdier er kendt som afvigelse fra det aritmetiske middel, og med disse søger vi at bestemme, hvor meget det aritmetiske gennemsnit af data varierer.

Den mest almindelige måde at finde denne værdi på er ved variansen, som er gennemsnittet af kvadraterne af afvigelserne fra det aritmetiske gennemsnit.

For at beregne det aritmetiske gennemsnit og variansen af ​​et sæt data grupperet i en klasse benytter vi henholdsvis følgende formler:

I disse udtryk xjeg  er i-th klasse mærke, fjeg repræsenterer den tilsvarende frekvens og k antallet af klasser, hvori dataene blev grupperet.

eksempel

Ved hjælp af de data, der er givet i det foregående eksempel, kan vi udvide dataene i frekvensfordelingsbordet lidt mere. Du får følgende:

Så når vi har erstattet dataene i formlen, har vi forladt, at det aritmetiske gennemsnit er:

Dens varians og standardafvigelse er:

Herfra kan vi konkludere, at de oprindelige data har et aritmetisk gennemsnit på 306,6 og en standardafvigelse på 39,56.

referencer

  1. Fernandez F. Santiago, Cordoba L. Alejandro, Cordero S. Jose M. Beskrivende statistikker. Esic Editorial.
  2. Jhonson Richard A.Miller og Freund Sandsynlighed og Statutter for Engineers.Pearson Education.
  3. Miller I & Freund J. Sandsynlighed og statsmænd for ingeniører. Reverte.
  4. Sarabia A. Jose Maria, Pascual Marta. Grundkursus for statistik for virksomheder
  5. Llinás S. Humberto, Rojas A. Carlos Beskrivende statistikker og sandsynlighedsfordelinger.Universidad del Norte Editorial