Karakteristike raspršivanja. Obilježja statističke distribucije. Kvaliteta površine dobivena valjanjem kuglastim alatom. Dijagram procesa, vrijednost tlaka, učestalost primjene deformirajuće sile, tehnološka oprema u procesima

Koliko god prosječne karakteristike bile važne, one nisu ništa manje važna karakteristika niza brojčanih podataka je ponašanje preostalih članova niza u odnosu na prosjek, koliko se razlikuju od prosjeka, koliko se članova niza značajno razlikuje od prosjeka. Tijekom treninga gađanja govore o točnosti rezultata; u statistici proučavaju karakteristike disperzije (širenja).

Razlika između bilo koje vrijednosti x i prosječne vrijednosti x naziva se devijacija i izračunava se kao razlika x, - x. U ovom slučaju, odstupanje može uzeti i pozitivne vrijednosti ako je broj veći od prosjeka i negativne vrijednosti ako je broj manji od prosjeka. Međutim, u statistici je često važno moći raditi s jednim brojem koji karakterizira "točnost" svih numeričkih elemenata niza podataka. Svako zbrajanje svih odstupanja članova niza dovest će do nule, jer će se pozitivna i negativna odstupanja međusobno poništiti. Kako bi se izbjeglo nuliranje, za karakterizaciju raspršenja koriste se kvadratne razlike, točnije aritmetička sredina kvadratnih odstupanja. Ova karakteristika rasipanja naziva se varijanca uzorka.

Što je veća varijanca, veće je raspršenje vrijednosti slučajne varijable. Za izračun disperzije koristi se približna vrijednost srednje vrijednosti x uzorka s marginom od jedne znamenke u odnosu na sve članove niza podataka. Inače, kod zbrajanja velika količina približne vrijednosti će akumulirati značajnu pogrešku. U vezi s dimenzionalnošću numeričkih vrijednosti, treba napomenuti jedan nedostatak takvog indikatora disperzije kao što je disperzija uzorka: mjerna jedinica disperzije D je kvadrat mjerne jedinice vrijednosti X, čija je karakteristika disperzija. Da bi se riješili ovog nedostatka, statistika je uvela takvu karakteristiku raspršenja kao standardna devijacija uzorka , što je označeno simbolom A (čitaj "sigma") i izračunava se pomoću formule

Obično se više od polovice članova niza podataka razlikuje od prosjeka za manje od standardne devijacije, tj. pripadaju segmentu [X - A; x + a]. Inače kažu: prosjek je, uzimajući u obzir širenje podataka, jednak x ± a.

Uvođenje druge karakteristike raspršenja povezano je s dimenzijom članova niza podataka. Sve numeričke karakteristike u statistici uvode se u svrhu usporedbe rezultata proučavanja različitih numeričkih nizova koji karakteriziraju različite slučajne varijable. Međutim, usporedba standardnih odstupanja od različitih prosječnih vrijednosti različitih skupova podataka nije indikativna, pogotovo ako su dimenzije tih veličina također različite. Na primjer, ako se usporede duljina i težina bilo kojeg predmeta ili raspršenost u proizvodnji mikro i makro proizvoda. U vezi s navedenim razmatranjima uvodi se relativna karakteristika raspršenja koja se naziva koeficijent varijacije a izračunava se po formuli

Za brojanje numeričke karakteristike Za raspršenje vrijednosti slučajnih varijabli zgodno je koristiti tablicu (tablica 6.9).

Tablica 6.9

Izračun numeričkih karakteristika raspršenja vrijednosti slučajne varijable

Xj- X

(Xj-X)2/

Srednja vrijednost uzorka je u procesu popunjavanja ove tablice. X, koji će se u budućnosti koristiti u dva oblika. Kao konačna karakteristika prosjeka (na primjer, u trećem stupcu tablice) prosjek uzorka X mora se zaokružiti na znamenku koja odgovara najmanjoj znamenki bilo kojeg člana niza numeričkih podataka x g Međutim, ovaj se pokazatelj koristi u tablici za daljnje izračune, au ovoj situaciji, naime pri izračunu u četvrtom stupcu tablice, prosjek uzorka X mora biti zaokružen s marginom od jedne znamenke u odnosu na najmanju znamenku bilo kojeg člana niza numeričkih podataka X (.

Rezultat izračuna pomoću tablice poput tablice. 6.9 dobit će se vrijednost disperzije uzorka, a za snimanje odgovora potrebno je na temelju vrijednosti disperzije uzorka izračunati vrijednost standardne devijacije a.

Odgovor označava: a) prosječni rezultat uzimajući u obzir širenje podataka u obrascu x±o; b) karakteristika stabilnosti podataka V. Odgovor bi trebao procijeniti kvalitetu koeficijenta varijacije: dobar ili loš.

Prihvatljivim koeficijentom varijacije kao pokazatelja homogenosti ili stabilnosti rezultata u sportskim istraživanjima smatra se 10-15%. Koeficijent varijacije V= 20% u bilo kojem istraživanju smatra se vrlo velikom brojkom. Ako je veličina uzorka n> 25, dakle V> 32% je jako loš pokazatelj.

Na primjer, za seriju diskretne varijacije 1; 5; 4; 4; 5; 3; 3; 1; 1; 1; 1; 1; 1; 3; 3; 5; 3; 5; 4; 4; 3; 3; 3; 3; 3 stola 6.9 popunjava se na sljedeći način (tablica 6.10).

Tablica 6.10

Primjer izračuna numeričke karakteristike raspršenosti vrijednosti

*1

fi

1

L n 25 = 2,92 = 2,9

D_S_47.6_ n 25

Odgovor: a) prosječna karakteristika, uzimajući u obzir širenje podataka, jednaka je X± a = = 3 ± 1,4; b) stabilnost dobivenih mjerenja je na niskoj razini, budući da je koeficijent varijacije V = 48% > 32%.

Analog stola 6.9 također se može koristiti za izračunavanje karakteristika raspršenja serije intervalnih varijacija. U isto vrijeme, opcije x g bit će zamijenjeni predstavnicima praznina x v i opcija apsolutnih frekvencija f(- na apsolutne frekvencije intervala f v

Na temelju gore navedenog može se učiniti sljedeće: zaključke.

Zaključci matematička statistika vjerojatan ako se obrađuju informacije o masovnim pojavama.

Obično se proučava uzorak iz opće populacije objekata koji bi trebao biti reprezentativan.

Eksperimentalni podaci dobiveni kao rezultat proučavanja bilo kojeg svojstva uzoraka objekata predstavljaju vrijednost slučajne varijable, budući da istraživač ne može unaprijed predvidjeti koji će broj odgovarati određenom objektu.

Za odabir jednog ili drugog algoritma za opisivanje i početnu obradu eksperimentalnih podataka važno je moći odrediti vrstu slučajne varijable: diskretnu, kontinuiranu ili mješovitu.

Diskretne slučajne varijable opisuju se diskretnim varijacijskim nizom i njegovim grafičkim oblikom - frekvencijskim poligonom.

Mješovite i kontinuirane slučajne varijable opisuju se nizom intervalnih varijacija i njegovim grafičkim oblikom - histogramom.

Pri usporedbi više uzoraka prema generiranoj razini određenog svojstva koriste se prosječne numeričke karakteristike i numeričke karakteristike raspršenja slučajne varijable u odnosu na prosjek.

Prilikom izračunavanja prosječne karakteristike važno je pravilno odabrati vrstu prosječne karakteristike koja je primjerena području njegove primjene. Strukturne prosječne vrijednosti, mod i medijan, karakteriziraju strukturu lokacije varijante u uređenom nizu eksperimentalnih podataka. Kvantitativni prosjek omogućuje prosudbu prosječne veličine opcije (prosjek uzorka).

Za izračunavanje numeričkih karakteristika raspršenja - varijance uzorka, standardne devijacije i koeficijenta varijacije - učinkovita je tablična metoda.

Karakteristike položaja opisuju središte distribucije. U isto vrijeme, značenja opcije mogu se grupirati oko nje iu širokom iu uskom pojasu. Stoga, da bi se opisala distribucija, potrebno je karakterizirati raspon promjena u vrijednostima karakteristike. Karakteristike raspršenja koriste se za opisivanje raspona varijacije karakteristike. Najviše se koriste raspon varijacije, disperzija, standardna devijacija i koeficijent varijacije.

Raspon varijacije definira se kao razlika između maksimalne i minimalne vrijednosti karakteristike u populaciji koja se proučava:

R=x max - x min.

Očita prednost pokazatelja koji se razmatra je jednostavnost izračuna. Međutim, budući da opseg varijacije ovisi o vrijednostima samo ekstremnih vrijednosti karakteristike, opseg njegove primjene ograničen je na prilično homogene distribucije. U drugim je slučajevima informativni sadržaj ovog pokazatelja vrlo malen, budući da postoji mnogo distribucija koje su vrlo različitih oblika, ali imaju isti raspon. U praktičnim studijama, raspon varijacije se ponekad koristi s malim (ne više od 10) veličinama uzoraka. Na primjer, iz raspona varijacija lako je procijeniti koliko se razlikuju najbolji i najlošiji rezultati u skupini sportaša.

U ovom primjeru:

R=16,36 – 13,04=3,32 (m).

Druga karakteristika raspršivanja je disperzija. Disperzija je prosječni kvadrat odstupanja slučajne varijable od njezine srednje vrijednosti. Disperzija je karakteristika raspršenja, širenja vrijednosti veličine oko njezine prosječne vrijednosti. Sama riječ "disperzija" znači "raspršenje".

Prilikom provođenja istraživanja uzorka potrebno je utvrditi procjenu varijance. Varijanca izračunata iz podataka uzorka naziva se varijanca uzorka i označava se S 2 .

Na prvi pogled, najprirodnija procjena varijance je statistička varijanca, izračunata na temelju definicije pomoću formule:

U ovoj formuli - zbroj kvadrata odstupanja vrijednosti atributa x i od aritmetičke sredine . Da bi se dobila srednja kvadratna devijacija, ovaj zbroj se podijeli s veličinom uzorka n.

Međutim, takva procjena nije nepristrana. Može se pokazati da je zbroj kvadrata odstupanja vrijednosti atributa za uzorak aritmetičke sredine manji od zbroja kvadrata odstupanja od bilo koje druge vrijednosti, uključujući i od prave sredine (matematičko očekivanje). Stoga će rezultat dobiven gornjom formulom sadržavati sustavnu pogrešku, a procijenjena vrijednost varijance bit će podcijenjena. Da bi se uklonila pristranost, dovoljno je uvesti faktor korekcije. Rezultat je sljedeći odnos za procijenjenu varijancu:

Za velike vrijednosti n Naravno, obje će se procjene - pristrana i nepristrana - vrlo malo razlikovati i uvođenje faktora korekcije postaje besmisleno. U pravilu, formulu za procjenu varijance treba doraditi kada n<30.

U slučaju grupiranih podataka, posljednja se formula može svesti na sljedeći oblik radi pojednostavljenja izračuna:

Gdje k- broj intervala grupiranja;

n i- frekvencija intervala s brojem ja;

x i- srednja vrijednost intervala s brojem ja.

Kao primjer, izračunajmo varijancu za grupirane podatke primjera koji analiziramo (vidi tablicu 4.):

S 2 =/ 28=0,5473 (m2).

Varijanca slučajne varijable ima dimenziju kvadrata dimenzije slučajne varijable, što otežava interpretaciju i čini je nejasnom. Za vizualniji opis raspršenja prikladnije je koristiti karakteristiku čija se dimenzija podudara s dimenzijom karakteristike koja se proučava. U tu svrhu uvodi se koncept standardna devijacija(ili standardna devijacija).

Standardna devijacija naziva se pozitivnim kvadratnim korijenom varijance:

U našem primjeru, standardna devijacija je jednaka

Standardna devijacija ima iste mjerne jedinice kao i rezultati mjerenja karakteristike koja se proučava i, prema tome, karakterizira stupanj odstupanja karakteristike od aritmetičke sredine. Drugim riječima, pokazuje kako se glavni dio opcije nalazi u odnosu na aritmetičku sredinu.

Standardna devijacija i varijanca najčešće su korištene mjere varijacije. To je zbog činjenice da su uključeni u značajan dio teorema teorije vjerojatnosti, koja služi kao temelj matematičke statistike. Osim toga, varijanca se može rastaviti na sastavne elemente, koji omogućuju procjenu utjecaja različitih čimbenika na varijaciju svojstva koje se proučava.

Uz apsolutne pokazatelje varijacije, a to su disperzija i standardna devijacija, u statistiku se uvode i relativni. Najčešće se koristi koeficijent varijacije. Koeficijent varijacije jednak omjeru standardne devijacije i aritmetičke sredine, izražen kao postotak:

Iz definicije je jasno da je, u svom značenju, koeficijent varijacije relativna mjera disperzije neke karakteristike.

Za predmetni primjer:

Koeficijent varijacije naširoko se koristi u statističkim istraživanjima. Budući da je relativna vrijednost, omogućuje vam usporedbu varijabilnosti obje karakteristike koje imaju različite mjerne jedinice, kao i iste karakteristike u nekoliko različitih populacija s različitim vrijednostima aritmetičke sredine.

Koeficijent varijacije koristi se za karakterizaciju homogenosti dobivenih eksperimentalnih podataka. U praksi tjelesne kulture i sporta, raspon rezultata mjerenja ovisno o vrijednosti koeficijenta varijacije smatra se malim (V<10%), средним (11-20%) и большим (V> 20%).

Ograničenja u korištenju koeficijenta varijacije povezana su s njegovom relativnom prirodom – definicija sadrži normalizaciju na aritmetičku sredinu. U tom smislu, pri malim apsolutnim vrijednostima aritmetičke sredine, koeficijent varijacije može izgubiti svoj informacijski sadržaj. Što je aritmetička sredina bliža nuli, to ovaj pokazatelj postaje manje informativan. U graničnom slučaju aritmetička sredina ide na nulu (npr. temperatura), a koeficijent varijacije ide u beskonačnost, bez obzira na širenje karakteristike. Analogno slučaju pogreške, može se formulirati sljedeće pravilo. Ako je vrijednost aritmetičke sredine u uzorku veća od jedan, tada je uporaba koeficijenta varijacije legalna; u suprotnom, disperzija i standardna devijacija trebaju se koristiti za opisivanje širenja eksperimentalnih podataka.

U zaključku ovog dijela razmotrit ćemo procjenu varijacija u vrijednostima ocjenjivačkih karakteristika. Kao što je već navedeno, vrijednosti karakteristika distribucije izračunate iz eksperimentalnih podataka ne podudaraju se s njihovim stvarnim vrijednostima za opću populaciju. Ovo posljednje nije moguće točno utvrditi, jer je u pravilu nemoguće anketirati cjelokupno stanovništvo. Ako koristimo rezultate različitih uzoraka iz iste populacije za procjenu parametara distribucije, ispada da se te procjene za različite uzorke međusobno razlikuju. Procijenjene vrijednosti fluktuiraju oko svojih stvarnih vrijednosti.

Odstupanja procjena općih parametara od pravih vrijednosti tih parametara nazivaju se statističke pogreške. Razlog njihove pojave je ograničena veličina uzorka - u njega nisu uključeni svi objekti u općoj populaciji. Za procjenu veličine statističkih pogrešaka koristi se standardna devijacija karakteristika uzorka.

Kao primjer, razmotrite najvažniju karakteristiku položaja - aritmetičku sredinu. Može se pokazati da je standardna devijacija aritmetičke sredine određena relacijom:

Gdje σ - standardna devijacija za populaciju.

Budući da prava vrijednost standardne devijacije nije poznata, veličina tzv standardna greška aritmetičke sredine i jednako:

Vrijednost karakterizira pogrešku koja je u prosjeku dopuštena pri zamjeni općeg prosjeka njegovom procjenom uzorka. Prema formuli, povećanje veličine uzorka tijekom studije dovodi do smanjenja standardne pogreške proporcionalno kvadratnom korijenu veličine uzorka.

Za primjer koji razmatramo, standardna pogreška aritmetičke sredine jednaka je . U našem slučaju pokazalo se da je to 5,4 puta manje od standardne devijacije.

Svrha rada

Upoznati se s pojavom raspršenja i naučiti odrediti njegove karakteristike.

Oprema

1. Ocijenjeni diskovi A 1 .

2. Ocijenjeni diskovi A 2 .

3. Mikrometar.

4. Stanite.

1. Opće informacije

Kada se serija dijelova proizvodi istim tehnološkim postupkom, od strane istih radnika, na istom radnom mjestu, pod istim uvjetima, odstupanja u vrijednostima parametara točnosti dijelova od idealnog prototipa i međusobno su promatrana. Ovaj fenomen dobio ime raspršivanje

U svim fazama tehnološkog procesa izrade dijela djeluje veliki broj slučajnih i sustavnih čimbenika koji se kontinuirano ili diskretno mijenjaju.

Sustavni čimbenici postoje:

– trajno (primjerice, pogreška u obliku površine koja se obrađuje, uzrokovana neusporednošću vodilica tokarilice s osi vretena; pogreška mjerenja itd.);

- mijenjanje prema određenom zakonu y = f(x) (na primjer, dimenzijsko trošenje alata, toplinska deformacija stroja itd.).

Slučajni faktori karakterizira ih velik broj, nedostatak međusobne povezanosti i nestabilnost (na primjer, elastični sklekovi karika sustava AIDS-a).

U praksi se fenomen disperzije bilo koje karakteristike kvalitete proučava pomoću dijagrama raspršenja, koji omogućuje određivanje svih karakteristika.

Za izgradnju dijagram raspršenosti duž osi apscise su redni brojevi mjerenja dijelova, a duž osi ordinata u obliku točaka su dobivene vrijednosti odgovarajućeg broja mjerenja dijelova (slika 1.1). Kroz točke koje odgovaraju maksimalnim i minimalnim mjernim vrijednostima povlače se dvije crte, paralelne jedna s drugom i s apscisnom osi. Udaljenost između ovih linija prva je karakteristika raspršenosti vrijednosti i naziva se polje lutanja ω = A nb A nm . Ova karakteristika nužno je dopunjena koordinatom središta polja raspršenja – ∆ ω , što je udaljenost između središta polja rasipanja i nominalne vrijednosti. Određuje položaj rasipnog polja u odnosu na nominalnu vrijednost.

Druga karakteristika fenomena raspršenja je praktična krivulja raspršenja i parametri koji je određuju. Za konstruiranje praktične krivulje raspršenja potrebno je polje lutanja ω na raspršenom dijagramu podijelite na 7...11 intervala linijama paralelnim s osi apscise. U svakom intervalu izbrojite broj rezultata mjerenja uključenih u njega (apsolutna frekvencija T) i prikazati tu veličinu u obliku pravokutnika širine jednake vrijednosti intervala i visine jednake apsolutnoj frekvenciji T.

Dobiveni dijagram naziva se raspršeni histogram. Prikazom apsolutne frekvencije T u obliku ravnih linija koje se nalaze u sredini svakog intervala (učitane ordinate), a spajajući njihove gornje točke ravnim segmentima dobivamo izlomljenu liniju tzv. praktična krivulja raspršenja mjerne vrijednosti (Sl. 2.1).


sl. 1.1. Raspršena parcela i praktična

mjerna vrijednost scatter curve

Parametri koji karakteriziraju praktičnu krivulju raspršenja su:

1. Jednadžba krivulje raspršenja y = φ(X). Za većinu problema procjene točnosti u tehnologiji strojarstva, distribucija trenutnih vrijednosti X ja pokorava se normalnom zakonu (Gaussov zakon), za koji

Uz Gaussov zakon, trenutne vrijednosti x i mogu se raspodijeliti prema zakonu jednake vjerojatnosti, Simpsonovom zakonu, Charlierovom zakonu itd.

2. Središte grupiranja Slučajna varijabla je prosječna vrijednost oko koje se nalazi najveći broj vrijednosti. Drugim riječima, središte grupiranja je vrijednost slučajne varijable koja pripada većini dijelova u seriji. Položaj središta grupiranja određen je koordinatom središta grupiranja (matematičko očekivanje) M(x).

3. Standardna devijacija σ, koji prikazuje gustoću grupiranja trenutnih vrijednosti u odnosu na središte grupiranja M(X). Grafički σ prikazan kao dvije apscise jednako udaljene od vrijednosti M(x) po iznosu σ, Ova karakteristika služi kao mjera disperzije.

4. Koeficijent relativne asimetrije a, koji prikazuje pomak središta grupiranja M(X) u odnosu na središte polja lutanja. Za diskretne veličine trenutne vrijednosti X ja karakteristike M(x), σ I A određuju jednakosti:

Gdje r(x i) = t/n broj mjernih vrijednosti koje spadaju unutar odgovarajućeg intervala, izražen kao postotak ili dio ukupnog broja izmjerenih vrijednosti (relativna frekvencija).

Izračunate karakteristike disperzije mjernih vrijednosti prikazane su grafički, uzimajući u obzir da na m ax ≈ 0,4/ σ , y σ ≈ 0.24/σ (Slika 2.2).

Riža. 2.2. Karakteristike fenomena raspršenja: M(x); σ ; A



2. Radni nalog

Rad u laboratoriju izvode dva tima. Fenomen rasipanja u ovom radu proučavan je na primjeru dvije serije dijelova od po 50 komada s apoenima A 1 , A 2 .

Ugradite (50 puta) obradak u steznu glavu s tri čeljusti i izmjerite aksijalni pomak.

Prilikom ugradnje dio mora biti čvrsto pritisnut svojom čeonom površinom na opremu, a kod ponovljenih ugradnji dio se mora zakrenuti oko svoje osi pod određenim kutom.

Zabilježite rezultate mjerenja nakon svake ugradnje dijela.

Na temelju rezultata mjerenja izradite dijagram raspršenja, histogram i krivulju raspršenja slično koraku 2 .

Odredite parametre koji karakteriziraju krivulju raspršenja, slično koraku 3 .

Usporedite rezultate pokusa i dovedite zaključke.

Konstruirajte dijagram ovih karakteristika fenomena raspršenja (slika 2.2).

1. Naslov, svrha i oprema rada.

2. Rezultati mjerenja dijelova s ​​nazivnim A 1 .

3. Dijagram raspršenja i karakteristike fenomena raspršenja.

4. Rezultati mjerenja dijelova s ​​nazivnim A 2 .

5. Dijagram raspršenja i karakteristike fenomena raspršenja.

6. Zaključci.

4. Ispitna pitanja

1. Što je pojava raspršenja?

2. Uz pomoć čega se proučava pojava raspršenja.

3. Navedite karakteristike pojave raspršenja.

4. Koji čimbenici djeluju tijekom procesa proizvodnje dijela?

5. Za što su sustavni čimbenici odgovorni u dijagramu raspršenja?

6. Za što su odgovorni slučajni čimbenici u dijagramu raspršenja?

7. Zašto bi broj intervala trebao biti neparan kada se konstruira praktična krivulja raspršenja?

8. Što je zalutalo polje?

9. Kolika je koordinata sredine polja rasipanja?

10. Zašto nam je potrebna koordinata sredine polja rasipanja?

11. Što je centar grupiranja?

12. Što je matematičko očekivanje?

13. Što pokazuje matematičko očekivanje?

14. Što se uzima kao mjera disperzije?

15. Navedite karakteristike tehnološkog procesa.

16. Navedite karakteristike pojave rasipanja pri obradi serije dijelova.

Za matematičku i statističku analizu rezultata uzorka nije dovoljno poznavanje samo karakteristika položaja. Ista prosječna vrijednost može karakterizirati potpuno različite uzorke.

Stoga, osim njih, statistika također razmatra karakteristike raspršivanja (varijacije, ili fluktuacije ) rezultate.

1. Raspon varijacija

Definicija. U opsegu varijacija je razlika između najvećeg i najmanjeg rezultata uzorka, označeno R i određen je

R=X max - X min.

Informativna vrijednost ovog pokazatelja je mala, iako je na malom uzorku lako procijeniti razliku između najboljih i najgorih rezultata sportaša.

2. Varijanca

Definicija. Varijanca naziva se prosječni kvadrat odstupanja karakterističnih vrijednosti od aritmetičke sredine.

Za negrupirane podatke, varijanca se određuje formulom

Gdje X ja– vrijednost atributa, - aritmetička sredina.

Za podatke grupirane u intervale, varijanca se određuje formulom

,

Gdje X ja– prosječna vrijednost ja interval grupiranja, n ja– intervalne frekvencije.

Kako bi se pojednostavili izračuni i izbjegle računske pogreške pri zaokruživanju rezultata (osobito pri povećanju veličine uzorka), za određivanje varijance koriste se i druge formule. Ako je aritmetička sredina već izračunata, tada se za negrupirane podatke koristi sljedeća formula:

 2 =
,

za grupirane podatke:

.

Ove formule dobivene su iz prethodnih tako da se pod znakom zbroja otkrije kvadrat razlike.

U slučajevima kada se aritmetička sredina i varijanca izračunavaju istovremeno, koriste se formule:

za negrupirane podatke:

 2 =
,

za grupirane podatke:

.

3. Srednji kvadrat(standard)devijacija

Definicija. Srednji kvadrat (standard ) devijacija karakterizira stupanj odstupanja rezultata od prosječne vrijednosti u apsolutnim jedinicama, budući da, za razliku od disperzije, ima iste mjerne jedinice kao i rezultati mjerenja. Drugim riječima, standardna devijacija pokazuje gustoću distribucije rezultata u skupini oko srednje vrijednosti, odnosno homogenost skupine.

Za negrupirane podatke standardna se devijacija može odrediti pomoću formula

 =
,

 =
ili =
.

Za podatke grupirane u intervale, standardna devijacija određena je formulama:

,

ili
.

4. Pogreška aritmetičke sredine (prosječna pogreška)

Greška aritmetičke sredine karakterizira fluktuaciju prosjeka i izračunava se formulom:

.

Kao što se može vidjeti iz formule, s povećanjem veličine uzorka, pogreška prosjeka se smanjuje proporcionalno kvadratnom korijenu veličine uzorka.

5. Koeficijent varijacije

Koeficijent varijacije definira se kao omjer standardne devijacije i aritmetičke sredine, izražen kao postotak:

.

Smatra se da ako koeficijent varijacije ne prelazi 10%, tada se uzorak može smatrati homogenim, odnosno dobivenim iz jedne opće populacije.

Uz najvjerojatnije vrijednosti rizika važan je i raspon mogućih vrijednosti rizika u odnosu na njegovu središnju vrijednost. Uzimanje u obzir širenja pokazatelja također je potrebno pri rješavanju problema socijalnog i higijenskog praćenja.

Najčešće karakteristike širenja slučajne varijable su varijanca i standardna devijacija.

Varijanca slučajne varijable ξ označava se kao D(ξ) (također se koristi oznaka V(ξ) i σ 2(ξ)), karakterizira najvjerojatnije vrijednosti kvadrata odstupanja slučajne varijable od njenog matematičkog očekivanja.

Za diskretnu slučajnu varijablu koja uzima vrijednosti x i s vjerojatnostima r ja, varijanca se definira kao ponderirani zbroj varijanci nitrata x i iz matematičkog očekivanja ξ s težinskim koeficijentima jednakim odgovarajućim vjerojatnostima:

D(ξ) =

Za kontinuiranu slučajnu varijablu ξ, njezina varijanca određena je formulom:

D(ξ) =

Disperzija ima sljedeća praktično važna svojstva:

1. Varijanca bilo koje slučajne varijable nije negativna:

D(ξ) ≥ 0

2. Varijanca konstantne vrijednosti je 0:

D(C) = 0

Gdje C je konstanta.

3. Varijanca slučajne varijable ξ jednaka je razlici između matematičkog očekivanja kvadrata te slučajne varijable i kvadrata matematičkog očekivanja ξ:

D(ξ) = M [ξ – M (ξ)] 2 = M(ξ 2) – ( .

4. Dodavanje konstante slučajnoj varijabli ne mijenja varijancu; množenje slučajne varijable s konstantom a dovodi do množenja varijance s a 2 :

D(aξ + b) = a 2 D(ξ),

Gdje A I b- konstante.

5. Varijanca zbroja nezavisnih slučajnih varijabli jednaka je zbroju njihovih varijanci:

gdje su ξ i η nezavisne slučajne varijable.

Standardna devijacija slučajne varijable ξ (također se koristi izraz "standardna devijacija") je broj σ (ξ) jednako kvadratnom korijenu varijance ξ:

Standardna devijacija mjeri odstupanje slučajne varijable od njenog matematičkog očekivanja u istim veličinama u kojima se mjeri sama slučajna varijabla (za razliku od varijance, čija je dimenzija jednaka kvadratu dimenzije izvorne slučajne varijable) . Za normalnu distribuciju standardna devijacija jednaka je parametru σ. Dakle, matematičko očekivanje i standardna devijacija predstavljaju kompletan skup karakteristika normalne distribucije i jedinstveno određuju vrstu gustoće distribucije. Za distribucije koje nisu normalne, ovaj par indikatora nije jednako učinkovita karakteristika distribucije.


Koeficijent varijacije također se koristi kao karakteristika raspršenja slučajne varijable. Koeficijent varijacije slučajne varijable ξ koja ima matematičko očekivanje različito od nule je broj V(ξ) jednak omjeru standardne devijacije ξ i njegovog matematičkog očekivanja:

Koeficijent varijacije mjeri disperziju slučajne varijable kao dio njenog matematičkog očekivanja i često se izražava kao postotak potonjeg. Ova se karakteristika ne smije koristiti ako je matematičko očekivanje blizu 0 ili značajno manje od standardne devijacije (u ovom slučaju male pogreške u određivanju matematičkog očekivanja dovode do velike pogreške u koeficijentu varijacije), kao i ako vrsta distribucije gustoće značajno se razlikuje od Gaussove.

Koeficijent asimetrije ( Kao) određuje 3. stupanj odstupanja slučajne varijable od matematičkog očekivanja i određuje se formulom:

U praksi se ovaj pokazatelj koristi kao ocjena simetričnosti distribucije. Za bilo koju simetričnu distribuciju jednaka je 0. Ako je gustoća distribucije asimetrična (što često može biti slučaj pri procjeni rizika od smrti i rizika povezanih s onečišćenjem vode i zraka), tada pozitivan koeficijent asimetrije odgovara slučaju kada lijevo rame krivulje gustoće je strmije od desnog, a negativno - u slučaju kada je desno rame strmije od lijevog (slika 4.17).

Za iskrivljene distribucije, standardna devijacija nije dobra mjera disperzije slučajne varijable. Da biste karakterizirali disperziju u ovom slučaju, možete koristiti pokazatelje kao što su kvartili, kvantili i percentili.

Prvi kvartil slučajne varijable ξ koja ima funkciju distribucije F(x) je broj P 1što je rješenje jednadžbe

F(Q 1) = 1/4

tj. broj za koji je vjerojatnost da ξ poprima vrijednosti manje od P 1, jednaka je 1/4, vjerojatnost da uzima vrijednosti veća P 1 jednako 3/4.

Drugi kvartil ( Q 2) slučajne varijable naziva se njezin medijan, a treći ( P 3) - rješenje jednadžbe

F(Q 3) = 3/4

Kvartili dijele x-os na 4 intervala: [-∞, P 1], [Q 1 , Q 2], [Q 2 , Q 3] i [ P 3, + ∞] u svakom od njih slučajna varijabla pada s jednakom vjerojatnošću, a lik omeđen apscisnom osi i grafom gustoće raspodjele pada u 4 područja s istom površinom. A interval između prvog i trećeg kvartila sadrži 50% distribucije slučajne varijable. Za simetrične distribucije, prvi i treći kvartil jednako su udaljeni od medijana.

Kvantilni poredak r slučajna varijabla ξ s funkcijom raspodjele F(x) je broj X, što je rješenje jednadžbe

Dakle, kvartili su kvantili reda 0,25, 0,5 i 0,75. Ako je poredak kvantila p izražen u postotku, onda odgovarajuće vrijednosti X nazivaju se percentili, ili r- postotni bodovi distribucije.

Na sl. Slika 4.18 prikazuje, zajedno s kvantilima, 2,5 i 97,5 postotnih bodova distribucije. Između ovih točaka koncentrirano je 95% distribucije slučajne varijable, pa se interval između njih naziva 95% interval pouzdanosti prosjeka (konkretno, kod procjene rizika - 95% interval pouzdanosti rizika).

Zadatak 2. Koja od sljedećih informacija o slučajnoj varijabli ξ omogućuje odbacivanje pretpostavke da je raspodijeljena prema normalnom zakonu:

a) ξ - diskretna slučajna varijabla;

b) matematičko očekivanje ξ je negativno;

c) raspodjela ξ je unimodalna;

d) matematičko očekivanje ξ nije jednako medijanu;

e) koeficijent asimetrije ξ je negativan;

f) standardna devijacija ξ je veća od svog matematičkog očekivanja;

g) ξ karakterizira distribuciju trajanja akutnih respiratornih bolesti u području istraživanja;

h) ξ karakterizira distribuciju očekivanog trajanja života u području istraživanja;

i) medijan ξ ne podudara se sa središtem intervala između prvog i trećeg kvartila.

Odgovor: Pretpostavka o normalnoj distribuciji slučajne varijable nije kompatibilna s tvrdnjama a), d), e), h), i).

Riža. 4.17. Ovisnost između predznaka sl.4.18. Kvartili i percentili:

koeficijent asimetrije i ilustracija oblika pomoću funkcije

funkcije gustoće distribucije