Suurem valem | Väljundite arvutamine samm-sammult (näite abil)
Varasem valem annab graafilise tööriista andmete arvutamiseks, mis asuvad väljaspool antud jaotuskomplekti, mis võib sõltuvalt muutujatest olla kas sisemine või välimine külg.
Mis on väljapoole jääv valem?
Varjund on antud valimi või antud vaatluse või jaotuse andmepunkt, mis jääb väljapoole üldist mustrit. Tavaliselt kasutatav reegel, mis ütleb, et andmepunkti loetakse piirväärtuseks, kui sellel on rohkem kui 1,5 IQR esimese kvartiili all või kolmanda kvartiili kohal.
Teisisõnu peavad madalad kõrvalekalded jääma alla Q1-1,5 IQR ja kõrged väljapoole jäävad Q3 + 1,5IQR
Tuleb arvutada mediaan, kvartiilid, sealhulgas IQR, Q1 ja Q3.
Välisvalem on esitatud järgmiselt:
Q1 valem = ¼ (n + 1) kolmas valem Q3 valem = ¾ (n + 1) kolmas valem Q2 = Q3 - Q1 valem
Kõrvaltoimete arvutamine samm-sammult
Väljundite arvutamiseks tuleb järgida allpool toodud samme.
- 1. samm: arvutage kõigepealt kvartiilid, st Q1, Q2 ja interkvartiil
- 2. samm: arvutage nüüd väärtus Q2 * 1,5
- 3. samm: lahutage Q1 väärtus 2. etapis arvutatud väärtusest
- 4. samm: lisage siia Q3 koos 2. etapis arvutatud väärtusega
- 5. samm: looge 3. ja 4. etapis arvutatud väärtuste vahemik
- 6. samm: korraldage andmed kasvavas järjekorras
- 7. samm: kontrollige, kas on väärtusi, mis jäävad 5. etapis loodud vahemikust madalamale või kõrgemale
Näide
Vaatleme järgmiste arvude andmekogumit: 10, 2, 4, 7, 8, 5, 11, 3, 12. Te peate arvutama kõik kõrvalekalded.
Lahendus:
Esiteks peame korraldama andmed kasvavas järjekorras, et leida mediaan, mis on meie jaoks Q2.
2, 3, 4, 5, 7, 8, 10, 11, 12
Kuna vaatluste arv on paaritu, mis on 9, asuks mediaan selle näite viiendal positsioonil, mis on 7 ja sama Q2.
Seetõttu on Q1 arvutus järgmine -
Q1 = ¼ (9 + 1)
= ¼ (10)
1. kvartal on -
Q1 = 2,5 tähtaega
See tähendab, et Q1 on vaatluse 2. ja 3. positsiooni keskmine, mis on siin 3 ja 4 ning sama keskmine on (3 + 4) / 2 = 3,5
Seetõttu on Q3 arvutus järgmine -
Q3 = ¾ (9 + 1)
= ¾ (10)
3. kvartal on -
Q3 = 7,5 tähtaeg
See tähendab, et Q3 on vaatluse 7. ja 8. positsiooni keskmine, mis on siin 10 ja 11, ja selle keskmine on (10 + 11) / 2 = 10,5
Nüüd jäävad madalad kõrvalekalded alla Q1-1.5IQR ja kõrged väljapoole Q3 + 1.5IQR
Seega on väärtused 3,5 - (1,5 * 7) = -7 ja suurem vahemik 10,5 + (1,5 * 7) = 110,25.
Kuna pole ühtegi vaatlust, mis oleks kas kõrgem või madalam kui 110,25 ja -7, pole meil selles valimis ühtegi kõrvalekaldet.
Näide valemist Excelis (Exceli malliga)
Selle Outlier Formula Exceli malli saate alla laadida siit - Outlier Formula Exceli mall
Loovate treenerite klassides kaalutakse õpilaste premeerimist, kes on 25% hulgas. Kuid nad soovivad vältida kõrvalekaldumisi. Andmed on 25 õpilase kohta. Kasutage Outlier võrrandit, et teha kindlaks, kas eksisteerib ka outlier?
Lahendus:
Allpool on esitatud andmed kõrvalarvude arvutamiseks
Vaatluste arv on siin 25 ja meie esimene samm oleks algandmete teisendamine kasvavas järjekorras.
Mediaan saab olema -
Mediaanväärtus = ½ (n + 1)
= ½ = ½ (26)
= 13. ametiaeg
Q2 ehk mediaan on 68,00
Mis on 50% elanikkonnast.
1. kvartal on -
Q1 = ¼ (n + 1) kolmas termin
= ¼ (25 + 1)
= ¼ (26)
= 6,5. Ametiaeg, mis on samaväärne 7. ametiajaga
Q1 on 56.00, mis on 25% alumine osa
3. kvartal on -
Lõpuks Q3 = ¾ (n + 1) kolmas termin
= ¾ (26)
= 19,50 tähtaeg
Siinkohal tuleb võtta 19. ja 20. termini keskmine, mis on 77 ja 77 ning sama keskmine (77 + 77) / 2 = 77,00
Q3 on 77, mis on ülemine 25%
Madal vahemik
Nüüd jäävad madalad kõrvalekalded alla Q1-1.5IQR ja kõrged väljapoole Q3 + 1.5IQR
Kõrge vahemik -
Seega on väärtused 56 - (1,5 * 68) = -46 ja kõrgem vahemik 77 + (1,5 * 68) = 179.
Väljaarvamisi pole.
Asjakohasus ja kasutusalad
Väljendite valem on väga oluline teada, kuna võib olla andmeid, mis sellise väärtuse tõttu moonutatakse. Võtke näide tähelepanekutest 2, 4, 6, 101 ja kui keegi võtab nende väärtuste keskmise, on see 28,25, kuid 75% vaatlustest on alla 7 ja seega oleks valimi tähelepanekute osas vale otsus.
Siinkohal võib märgata, et 101 näib selgelt piiravat ja kui see eemaldatakse, oleks keskmine 4, mis ütleb väärtuste või tähelepanekute kohta, et need jäävad vahemikku 4. Seetõttu on selle arvutamise vältimiseks väga oluline mis tahes andmete väärkasutamine. Neid kasutavad statistikud kogu maailmas laialdaselt alati, kui nad mingeid uuringuid teevad.