Calculul principalelor caracteristici statistice și relația dintre rezultatele măsurătorilor. Analiză analitică. Caracteristicile statistice de bază ale unei serii de măsurători Caracteristicile statistice de bază ale datelor

Statistica este una dintre cele mai vechi ramuri ale matematicii aplicate, care folosește pe scară largă baza teoretică a multor definiții aritmetice pentru implementarea activităților umane practice. Chiar și în statele antice, a devenit necesară înregistrarea strictă a veniturilor cetățenilor pe grupuri pentru a desfășura un proces de impozitare eficient. Cercetarea statistică este de mare importanţă pentru dezvoltare economică societate și nu numai. Prin urmare, în acest tutorial video ne vom uita la definițiile de bază ale caracteristicilor statistice.

Să presupunem că trebuie să studiem statisticile finalizării testului de către elevii de clasa a șaptea. În primul rând, trebuie să creăm o serie de informații cu care să putem lucra. Informațiile, în acest caz, vor fi numerele care determină numărul de teste finalizate de fiecare dintre elevi. Luați în considerare două clase care conțin 15 elevi fiecare. Sarcina generală a inclus 10 exerciții. Rezultatele sunt următoarele:

7A: 4, 10, 6, 4, 7, 8, 2, 10, 8, 5, 7, 9, 10, 6, 3;

7B: 7, 5, 9, 7, 8, 10, 7, 1, 7, 6, 5, 9, 8, 10, 7.

Am primit, în interpretare matematică, două seturi de numere, fiecare constând din 15 elemente. Această gamă de informații, în sine, este de puțin ajutor în evaluarea eficienței îndeplinirii sarcinilor. Prin urmare, trebuie transformat statistic. Pentru a face acest lucru, introducem conceptele de bază ale statisticii. O serie de numere obținute în urma studiului se numește eșantion. Fiecare număr (număr de exerciții finalizate) este o opțiune de eșantionare. Și numărul tuturor numerelor (în acest caz, este 30 - suma tuturor elevilor din ambele clase) este dimensiunea eșantionului.

Una dintre principalele caracteristici statistice este media aritmetică. Această valoare este definită ca un coeficient obținut prin împărțirea sumei valorilor variantei eșantionului la dimensiunea acesteia. În cazul nostru, este necesar să adunăm toate valorile obținute ale numerelor și să le împărțim la 15 (dacă calculăm media aritmetică pentru orice clasă) sau la 30 (dacă calculăm media aritmetică totală). ). În exemplul prezentat, suma tuturor sarcinilor finalizate pentru clasa 7A va fi 99. Împărțind la 15, obținem 6,6 - aceasta este media aritmetică a sarcinilor finalizate pentru acest grup de elevi.

Lucrul cu un set haotic de numere nu este foarte convenabil, așa că de foarte multe ori o matrice de informații duce la un set ordonat de date. Să creăm o serie de variații pentru clasa 7B utilizând metoda creșterii treptate, aranjând numerele de la cel mai mic la cel mai mare:

1, 5, 5, 6, 7, 7, 7, 7, 7, 8, 8, 9, 9, 10, 10.

Numărul de apariții ale oricărei valori dintr-un eșantion de date se numește frecvență de eșantionare. De exemplu, frecvența opțiunilor „7” din seria de variații de mai sus este ușor de determinat și este egală cu cinci. Pentru comoditatea afișajului, seria ordonată este convertită într-un tabel care arată relația dintre seria standard de valori ale variantelor și frecvența de apariție (numărul de studenți care au finalizat același număr de sarcini).

În clasa 7A, cea mai mică opțiune de eșantion este „2”, iar cea mai mare este „10”. Intervalul dintre 2 și 10 se numește intervalul seriei de variații. Pentru clasa 7B, intervalul seriei este de la 1 la 10. Cea mai mare variantă, în ceea ce privește frecvența de apariție, se numește modul de eșantionare - pentru 7A acest număr este 7, care apare de 5 ori.

Laboratorul #9

Analiza datelor statistice

Obiectiv: învață cum să procesezi datele statistice în foi de calcul folosind funcții încorporate; explorați posibilitățile pachetului de analiză în MS Excel 2010 și unele dintre instrumentele acestuia: generarea numerelor aleatorii, histograma, statistica descriptivă.

Partea teoretică

Foarte frecvente pentru prelucrarea datelor sondajului un numar mare obiecte sau fenomene ( date statistice), se folosesc metode de statistică matematică.

Statistica matematică modernă este împărțită în două domenii mari: descriptivși statistici analitice. Statistica descriptivă acoperă metode de descriere a datelor statistice, de prezentare a acestora sub formă de tabele, distribuții etc.

Statistica analitică este numită și teoria inferenței statistice. Subiectul său este prelucrarea datelor obținute în timpul experimentului și formularea unor concluzii care sunt de importanță aplicată pentru diverse domenii ale activității umane.

Se numește setul de numere obținute în urma sondajului agregat statistic.

set de prelevare(sau prelevarea de probe) este un set de obiecte selectate aleatoriu. Populația generală este ansamblul de obiecte din care este realizată proba. Volum set (general sau eșantion) este numărul de obiecte din acest set.

Pentru prelucrarea statistică, rezultatele studiului obiectelor sunt prezentate sub formă de numere X 1 ,X 2 ,…, x k. Dacă valoarea X 1 observat n 1 dată, valoare X 2 observat n de 2 ori etc., apoi valorile observate x i numit Opțiuni, și numărul de repetări ale acestora n i numit frecvente. Procedura de numărare a frecvențelor se numește grupare de date.

Marime de mostra n este egală cu suma toate frecventele n i:

Frecventa relativa valorile x i se numește raportul de frecvență al acestei valori n i la dimensiunea eșantionului n:

Distribuția statistică a frecvenței(sau pur și simplu distribuția de frecvență) se numește o listă de opțiuni și frecvențele corespunzătoare acestora, scrise sub forma unui tabel:



Distribuția relativă a frecvenței numită o listă de opțiuni și frecvențele relative respective ale acestora.


Caracteristici statistice de bază.

Foile de calcul moderne au un set imens de instrumente pentru analiza datelor statistice. Cele mai frecvent utilizate funcții statistice sunt încorporate în nucleul principal al programului, adică aceste funcții sunt disponibile din momentul lansării programului. Alte funcții mai specializate sunt incluse în rutine suplimentare. Mai exact, în Excel, o astfel de rutină se numește un pachet de instrumente de analiză. Comenzile și funcțiile pachetului de analiză se numesc Instrumente de analiză. Ne vom limita la câteva funcții statistice de bază încorporate și la cele mai utile instrumente de analiză din suita de analiză într-o foaie de calcul Excel.

Rău.

Funcția MEDIE calculează media eșantionului (sau generală), adică media aritmetică a caracteristicii populației eșantionului (sau generală). Argumentul funcției AVERAGE este un set de numere, de obicei specificat ca un interval de celule, de exemplu, =AVERAGE(A3:A201).

Tipul de lecție: lecție de învățare material nou.

Scopul lecției: Crearea condiţiilor pentru asimilarea temei la nivel de înţelegere şi memorare primară; pentru a forma competenţa matematică a personalităţii elevului

Educational: formați o idee despre statistică ca știință; să familiarizeze elevii cu conceptele de caracteristici statistice de bază; pentru a forma capacitatea de a găsi media aritmetică, intervalul, modul, mediana unei serii, analiza datelor.
În curs de dezvoltare: promovează cunoașterea conceptelor și interpretarea acestora; dezvoltarea abilităților de analiză, comparație, sistematizare și generalizare a suprasubiectului; să promoveze formarea competențelor cheie (cognitive, informaționale, comunicative) în diferite etape ale lecției, să promoveze formarea unui tablou științific lume prin identificarea relaţiilor interdisciplinare dintre statistică şi diverse ştiinţe.
Educational: dezvolta interesul pentru subiectul studiat cultura informaţiei; disponibilitatea de a respecta normele și regulile general acceptate, eficiență și organizare ridicate.

Tehnologii folosite: Tehnologia MDO.
Echipamentul necesar, materiale: proiector multimedia, calculator, tabla interactiva.

Planul lecției

Organizarea timpului. Clasa este împărțită în 4 grupe.

Includeți un videoclip din filmul Office Romance.

Fișier WMV (.wmv)

Despre ce crezi că vom vorbi astăzi?

…….. corect, despre statistici

Ce este statistica? (Diapozitivul 2)

…….. aceasta este definiția pe care ne-o oferă dicționarul (Diapozitivul 3)

Afectează statisticile viața oamenilor, societatea? Exprimați-vă presupunerile așa cum doriți.

Statistica ca știință include diferite secțiuni: politică, economică, aplicată, juridică, medicală etc.

Ne va interesa statistica matematică. Ce este special la statistica matematică?

…….. bineînțeles cu ajutorul matematicii (Diapozitivul 4)

Statistica matematică are o serie de caracteristici. (Întoarce cuvântul „statistici” de pe tablă).

Conceptele sunt în fața ta. (tablete pe tablă cu cuvintele: bisectoare, lunula, catâri, medie aritmetică, mediană, mod, interval, diametru, medie, maxim, optim, invariant, constantă, înălțime) Ghici care dintre ele poate fi clasificat ca statistic, ce înseamnă crezi?

(Cuvinte sugerate puse după cuvântul caracteristici statistice)

Acum veți apela la texte care vă vor ajuta să vă confirmați sau să vă respingeți presupunerile: dacă conceptele alese sunt caracteristici statistice și cât de mare este impactul statisticilor asupra vieții societății. Fiecare elev a primit un tabel (Anexa 1), pe care trebuie să-l completeze în timpul lecției Să ne amintim regulile de lucru în grup: calm, independent, într-un mod de afaceri, cu repartizarea responsabilităților. Grupul trebuie să completeze tabelul (Anexa 2)

Lucru de grup. Texte pentru grupuri. Anexa 3. (10 min)

Protecție (tobogan cu definiție + diapozitiv cu sarcină)

Asigurați-vă că completați listele de verificare. (Întrebăm fiecare grup care a notat ce anume pentru ei înșiși conform acestei caracteristici în foaia de memorii) (Anexa 1.2)

In medie

Pune ordine în caracteristicile statistice

(lasa doar 4 caracteristici)

Grupa 1 merge la tablă și vorbește despre caracteristicile statistice - media aritmetică, rezolvarea problemelor propuse, concluzii. (Diapozitivul 5.6).

Grupa 2 merge la tablă și vorbește despre caracteristicile statistice - modă, rezolvarea problemelor propuse, concluzii. (diapozitivul 7.8)

Grupa 3 merge la tablă și vorbește despre caracteristicile statistice - domeniul de aplicare, rezolvarea sarcinilor propuse, concluzii. (diapozitivul 9,10)

Grupul 4 merge la tablă și vorbește despre caracteristica statistică - mediana, rezolvarea sarcinilor propuse, concluzii. (diapozitivul 11, 12)

Toate grupurile au ajuns la concluzia că există o relație între viața societății și statistică, influența este mare, chiar și atunci când nu ne asumăm.

Să ne întoarcem la diapozitive și să vedem cum se pot manifesta caracteristicile statistice în viața noastră de zi cu zi (Diapozitive cu glume 13-19, 20).

Acum vă oferim să lucrați ca figuranți. (Sunt distribuite 4 sarcini cu conținut practic) (7 minute)

Deci, cu ce caracteristică statistică ați lucrat la prima sarcină, ce ați obținut

…….. modă - culoarea ochilor și a părului (faceți un sondaj rapid pentru fiecare grup)

…….. span - lățimea palmei (efectuați un sondaj rapid al fiecărui grup)

cu ce caracteristică statistică ați lucrat la a treia sarcină, ce ați obținut

…….. mediană - mărimea pantofilor (efectuați un sondaj rapid pentru fiecare grup)

cu ce caracteristică statistică ai lucrat la a doua sarcină, ce ai obținut

…….. medie aritmetică - creștere (efectuați un sondaj rapid pentru fiecare grup)

Judecând după rezultate, tânărul mediu din clasa noastră arată așa (Diapozitivul 21)

Și fata este așa (Diapozitivul 22)

Într-o notă atât de optimistă, ne încheiem lecția.

(Răspunsuri la sarcini Anexa 5)

Atasamentul 1.

Anexa 2

Anexa 3

Grupa 1. Statistici studiază numărul de grupuri individuale ale populației țării și regiunilor acesteia, producția și consumul diferitelor tipuri de produse, transportul de mărfuri și pasageri prin diferite moduri de transport, Resurse naturale etc. Rezultatele studiilor statistice sunt utilizate pe scară largă pentru concluzii practice și științifice.

medie aritmetică O serie de numere se numește caracteristică statistică, care vă permite să găsiți câtul din împărțirea sumei acestor numere la numărul de termeni. De obicei, media aritmetică se găsește atunci când se dorește să determine valoarea medie pentru o anumită serie de date: randamentul mediu de grâu la 1 hectar în zonă, randamentul mediu zilnic de lapte de la o vacă din fermă, producția medie a unei muncitor etc. Rețineți că media aritmetică se găsește numai pentru valori omogene.

De exemplu, la studierea sarcinii de studiu a elevilor, a fost identificat un grup de 12 elevi de clasa a VII-a. Li s-a cerut să înregistreze într-o anumită zi timpul (în minute) necesar pentru finalizare teme pentru acasăîn algebră. Am obținut următoarele date: 23, 18, 25, 20, 25, 25, 32, 37, 34, 26, 34, 25.

Cu această serie de date, putem determina câte minute au petrecut elevii în medie făcând temele de algebră. Pentru a face acest lucru, trebuie adăugate numerele indicate și suma rezultată împărțită la cantitate, adică. în acest caz 12:

mier ritmul. ===27

Astfel, am constatat că elevii au petrecut în medie 27 de minute teme de algebră.

Găsiți media aritmetică în următoarele probleme:

Sarcina 1. Din lista de poluanți ai aerului din surse staționare din Khanty-Mansi Autonomous Okrug-Yugra, selectați mai întâi emisiile celor mai comune substanțe, apoi determinați cantitatea medie a acestor emisii timp de trei ani, prezentată în tabel în mii de tone.

solide

substanțe gazoase și lichide

dioxid de sulf

oxizi de azot

monoxid de carbon

Sarcina 2. Determinați temperatura medie a aerului în orașul Uray pe 14 februarie 2017, dacă se știe că pe site-urile: Yandex -9 oC, Gismeteo -11 oC, rp5 -16 oC, - 11 oC, meteonovosti -15 oC, meteonova -10 oC, sinoptic -11 oC.

Rolul statisticilor în viața noastră este atât de semnificativ încât oamenii adesea, fără ezitare și fără să-și dea seama, folosesc în mod constant elemente de metodologie statistică nu numai în procesele de muncă, ci și în viața de zi cu zi. Muncește și relaxează-te, cumpărături, întâlnire cu alți copii, luarea unor decizii, o persoană folosește un anumit sistem, informațiile pe care le deține, gusturile și obiceiurile predominante, fapte, sistematizează, compară aceste fapte, le analizează, trage o concluzie și ia anumite decizii. ia măsuri concrete. Astfel, în fiecare persoană există elemente de gândire statistică, adică capacitatea de a analiza și sintetiza informații despre lumea din jur.

Grupa 2

Sensul cuvântului " statistici

Rezultatele studiilor statistice sunt utilizate pe scară largă pentru concluzii practice și științifice.

La procesarea datelor, statisticile folosesc unele caracteristici, dintre care una este modul. Moda este folosită, de exemplu, în determinarea mărimii hainelor, pantofilor, care sunt cele mai solicitate în rândul cumpărătorilor.

Modă serie - valoarea din multimea de observatii care apare cel mai frecvent. Moda = tipic. În seria 3,4,3,5,5,4,5,3,5 modul = 5. Ca număr care apare cel mai frecvent.

Uneori, în total, apar mai multe moduri. De exemplu: 6, 2, 6, 6, 8, 9, 9, 9, 10; mod = 6 și 9. În acest caz, putem spune că populația este multimodală. Dintre mediile structurale, numai modul are această proprietate unică.

Nu există modă în seria numerelor 69,68,72,74,89,87,84.

Modul ca medie este folosit mai des pentru datele nenumerice. Printre culorile mașinii enumerate - alb, negru, albastru metalic, alb, albastru metalic, alb - moda va fi egală cu alb. Cu ajutorul unei evaluări de specialitate, cele mai populare tipuri de produs sunt determinate cu ajutorul acestuia, care este luat în considerare atunci când se prognozează vânzările sau se planifică producția lor.

Rezolvați următoarele sarcini:

Sarcina 1.În râurile Khanty-Mansiysk Okrug autonom Mulți pești trăiesc în râul Bolshoy Yugan, locuiți de știucă, biban, gândac, caras, ide și loviță. Pestii traiesc in raul Agan: stiuca, biban, gandacul, sterletul, carasul, ide, burbot, nelma. Peștii trăiesc în râul Vakh: știucă, biban, gândac. Pestii traiesc in raul Tromgan: stiuca, biban, gandacul, carasul, ide, mosta. Totalitatea peștilor din Okrug-Yugra autonom Khanty-Mansi este multimodală (știuca, bibanul și gândacul se găsesc în toate râurile din district. Determinați cei mai tipici pești din râurile prezentate.

Zalacha 2. Tabelul arată consumul de energie electrică în luna ianuarie de către locuitorii a 9 apartamente

Determinați modul acestei serii

Grupa 3. Sensul cuvântului " statistici a suferit schimbări semnificative în ultimele două secole. Cuvântul „statistică” are aceeași rădăcină ca și cuvântul „stat” și însemna inițial arta și știința guvernării: primii profesori de statistică din universitățile germane din secolul al XVIII-lea s-ar numi astăzi oameni de științe sociale. Deoarece deciziile guvernamentale se bazează într-o oarecare măsură pe date despre populație, industrie etc. statisticienii, bineînțeles, au devenit interesați de astfel de date și, treptat, cuvântul „statistică” a început să însemne culegerea de date despre populație, despre stat și apoi în general colectarea și prelucrarea datelor. Nu are rost să extragem date dacă nu există niciun beneficiu care să fie derivat din acestea. Prin urmare, una dintre sarcinile principale ale statisticii este prelucrarea corectă a informațiilor.

Astăzi, statisticile și analiza datelor pătrund în aproape orice domeniu modern de cunoaștere: economie, publicitate, marketing, afaceri, medicină, educație etc. Ea determină dinamica dezvoltării, declinului sau creșterii fenomenelor sociale. Aceasta este o știință care rezolvă anumite probleme datorită disponibilității și dezvoltării metodelor statistice, inclusiv datorită dezvoltării tehnologia de informație.

La prelucrarea datelor, statisticile utilizează unele caracteristici, dintre care una este mediana.

Median numită valoarea cantităţii situate în centrul seriei ordonate.

Mediana împarte seria în două părți egale, astfel încât să existe același număr de unități pe ambele părți ale acesteia. În același timp, pentru o jumătate, valoarea atributului nu este mai mare decât mediana, pentru cealaltă jumătate, nu este mai mică.

Mediana se găsește conform următorului algoritm:

Aranjați numerele în ordine crescătoare

Dacă seria conține un număr impar de elemente, atunci mediana este numărul din mijloc;

Dacă seria conține un număr par de elemente, mediana se află între cele două elemente din mijloc ale seriei și este egală cu media aritmetică calculată pentru aceste două elemente.

Exemplu. Găsiți mediana seriei 16,13,15,10,19,22,25,12,18,14,19,14,16,10.

Soluţie. Să construim o serie în ordine crescătoare: 10,10,12,13,14,14,15,16,16,18,19,19,22,25, conține un număr par de elemente n=14, deci mediana se află între cele două elemente din mijloc ale eșantionului - între 7 și 8 elemente: 10,10,12,13,14,14,15,16,16,18,19,19,22,25 și este egal cu media aritmetică a acestor elemente: Me=(15+16 )/2=15.5

Să dăm exemple de utilizare reală a mediei în statistici. Deci, atunci când analizați rezultatele afișate de participanții la cursă, mediana vă permite să selectați un grup de sportivi care au arătat un rezultat peste medie și să îi plasați în următoarea etapă a competiției.

matematic proprietate mediană este că suma abaterilor absolute (modulo) de la valoarea mediană dă valoarea minimă posibilă. Acest lucruîși găsește aplicația, de exemplu, în rezolvarea problemelor de transport, atunci când este necesar să se calculeze șantierul unui obiect din apropierea drumului în așa fel încât lungimea totală a zborurilor către acesta din diferite locuri să fie minimă (stații, benzinării, depozite etc., etc.) .

Rezolvați următoarele sarcini:

Sarcina 1. Costurile curente de securitate mediu inconjuratorîn regiunea autonomă Khanty-Mansi s-a ridicat la milioane de ruble:

Găsiți mediana acestei serii.

Grupa 4. Statistici- o știință care se ocupă cu obținerea, prelucrarea și analizarea datelor cantitative despre diverse fenomene de masă care au loc în natură și societate.

Una dintre sarcinile principale ale statisticii este prelucrarea corectă a informațiilor. Desigur, statistica are multe altele: obținerea și stocarea informațiilor, realizarea de diverse prognoze, evaluarea fiabilității acestora etc.

Unul dintre indicatorii statistici ai diferenței sau răspândirii datelor este „Intervalul”. în mare măsură seria este diferența dintre cel mai mare și cel mai mic dintre aceste numere. Să analizăm problema: La studierea volumului de muncă al elevilor, a fost identificat un grup de 12 persoane. Li s-a cerut să marcheze timpul (în minute) petrecut într-o anumită zi făcând temele de algebră. Am obținut următoarele date: 23, 18, 25, 20, 25, 25, 32, 37, 34, 26, 34, 25.

Cel mai mare consum de timp este de 37 de minute, iar cel mai mic este de 18 minute. Găsiți gama seriei:

37-18=19 minute.

Rezolvați următoarele sarcini:

Sarcina 1. Râul Ob este o arteră Vestul Siberieiși își poartă apele printr-o țară ca Rusia. Lungimea cursului de apă este de 3650 km. Râul Ob este al doilea dintre râurile Rusiei, al doilea după Lena. Împreună cu afluentul său Irtysh, Ob se află pe primul loc ca lungime în Rusia (5410 km.) Și pe locul doi în Asia (lângă HPP), scade la 8 m în apropierea gurii Tomului și crește din nou. la 15 m în cursul superior al Golfului Ob, unde curge râul. Găsiți intervalul de adâncime a râului Ob.

Sarcina 2.În perioada 17 - 19 decembrie, abaterea temperaturii medii zilnice de la norma în regiunea autonomă Khanty-Mansiysk a ajuns la 16-26 de grade. Și pe 21 decembrie, administrația districtului Beloyarsky al Okrugului autonom Khanty-Mansi a raportat o temperatură de frig la -62 ° C, în Khanty-Mansiysk - 40 °, în Surgut - 43 °, în Urai - 38 °, în Yugorsk - 42 °, în Kondinsk - 33 °. Găsiți intervalul de temperatură al datelor aşezări.

Statistica studiază numărul de grupuri individuale ale populației țării și regiunilor acesteia, producția și consumul diferitelor tipuri de produse, transportul de mărfuri și pasageri prin diferite moduri de transport, resurse naturale etc. Rezultatele studiilor statistice sunt utilizate pe scară largă pentru concluzii practice și științifice.

Rolul statisticilor în viața noastră este atât de semnificativ încât oamenii adesea, fără ezitare și fără să-și dea seama, folosesc în mod constant elemente de metodologie statistică nu numai în procesele de muncă, ci și în viața de zi cu zi. Muncește și relaxează-te, cumpărături, întâlnire cu alți copii, luarea unor decizii, o persoană folosește un anumit sistem, informațiile pe care le deține, gusturile și obiceiurile predominante, fapte, sistematizează, compară aceste fapte, le analizează, trage o concluzie și ia anumite decizii. ia măsuri concrete. Astfel, în fiecare persoană există elemente de gândire statistică, adică capacitatea de a analiza și sintetiza informații despre lumea din jur. Rezultatele studiilor statistice sunt utilizate pe scară largă pentru concluzii practice și științifice.

Anexa 4

Sarcina 1. Intervievați 10 persoane din clasă. Determinați cele mai comune dintre ele

culoarea parului si a ochilor. Cu ce ​​statistică ai lucrat?

Sarcina 2. Intervievați 10 persoane din clasă. Măsurați lățimea palmelor lor. Găsește diferența

cele mai mari si cele mai mici valori. Ce statistică este folosită

în această sarcină?

Sarcina 3. Intervievați 9 persoane din clasă. Aflați mărimea lor de pantofi. Aliniați numerele în

ordine crescătoare. Determinați mediana seriei.

Sarcina 4. Intervievați 10 persoane din clasă. Aflați înălțimea lor. Aflați înălțimea medie

respondenţi. Cu ce ​​tip de statistici ai lucrat?

Anexa 5

Răspunsuri la sarcini.

In medie

Știucă, biban, gândac

Una dintre sarcinile principale ale statisticii este prelucrarea corectă a informațiilor. Desigur, statistica are multe alte sarcini: obținerea și stocarea informațiilor, realizarea de previziuni diverse, evaluarea fiabilității acestora etc. Dar niciunul dintre aceste obiective nu poate fi atins fără prelucrarea datelor. Prin urmare, este necesar mai întâi să evidențiem principalele caracteristici ale datelor statistice.

Foile de calcul Excel au un set imens de instrumente pentru analiza datelor statistice. Cele mai frecvent utilizate funcții statistice sunt încorporate în nucleul principal al programului, adică aceste funcții sunt disponibile din momentul lansării programului. Alte funcții mai specializate sunt incluse într-o subrutină suplimentară numită pachet de analiză. Comenzile și funcțiile pachetului de analiză se numesc Instrumente de analiză.

Luați în considerare principalele caracteristici ale datelor eșantionului.

Rău.

Cu ajutorul valorii medii se calculează media eșantionului (sau generală), adică valoarea medie aritmetică a semnului populației eșantionului (sau generală). Excel calculează media după cum urmează: =SUM(F4:F60)/COUNT(F4:F60). Tot in Excel exista si o functie de calcul: MEDIE. Argumentul funcției este un set de numere, de obicei specificat ca un interval de celule, de exemplu: =AVERAGE(A3:A201).

Varianța eșantionului și abaterea standard a eșantionului.

Varianta eșantion de valori variabilă aleatorie X se numește media aritmetică a abaterilor pătrate ale valorilor observate ale acestei mărimi față de media lor aritmetică:

Dispersia caracterizează abaterea de la media în unități pătrate măsurarea unei trăsături, prin urmare, se folosește un indicator precum abaterea standard, care se măsoară în aceleași unități ca și trăsătura studiată.

Abaterea standard a eșantionului este determinată de formula:

Excel are funcții care calculează separat varianța eșantionului Dv deviație standard înși variația generală D G și abaterea standard d. Prin urmare, înainte de a calcula varianța și abaterea standard, ar trebui să determinați clar dacă datele dumneavoastră sunt o populație sau un eșantion. În funcție de aceasta, trebuie să utilizați pentru calcul D g și g, Dvși în.

Calcularea variației eșantionului Dvși abaterea standard a eșantionului în realizat cu urmatoarele functii: = SUMA((4: 60 ? 28)^2)/ (COUNT(4: 60)) și = ROOT(29).

Excel are funcțiile VARP (sau VAR) și STDEV (sau STDEV).

Argumentul acestor funcții este un set de numere, de obicei dat de un interval de celule, de exemplu, =VAR(B1:B48).

Pentru a calcula varianța generală D r și abaterea standard generală r au funcțiile VARP (sau VARP) și, respectiv, STDEVP (sau STDEVP).

Argumentele acestor funcții sunt aceleași ca și pentru varianța eșantionului.

Volumul populației.

Volumul unui eșantion sau al unei populații generale este numărul de elemente din populație. Funcția COUNT (sau COUNT) determină numărul de celule dintr-un interval dat care conțin date numerice. Celulele goale sau celulele care conțin text sunt ignorate de funcția COUNT. Argumentul funcției COUNT este un interval de celule, de exemplu: = COUNT (С2:С16).

Pentru a determina numărul de celule nevide, indiferent de conținutul acestora, se folosește funcția COUNT3. Argumentul său este gama de celule.

Mod și mediană.

Modul (?) este valoarea caracteristicii care apare mai des decât altele din setul de date. Este calculat de funcția MODE (sau MODE). Argumentul său este intervalul de celule cu date. Modul nu este calculat la examinarea NE.

Mediana (?) este valoarea atributului, care împarte populația în două părți egale ca număr de elemente. Pentru o serie de variații cu un număr impar de membri, mediana este egală cu opțiunea de mijloc, iar pentru o serie cu un număr par de membri, este jumătate din suma celor două opțiuni de mijloc. Este calculat de funcția MEDIAN (sau MEDIAN). Argumentul său este gama de celule.

Gama de variație. Cele mai mari și cele mai mici valori.

Gama de variație R este diferența dintre cele mai mari X max și cele mai mici valori xmin ale semnului populației (general sau eșantion): R=X max- X min.

Pentru găsire cea mai mare valoare X max există o funcție MAX (sau MAX), iar pentru cel mai mic X min este funcția MIN (sau MIN). Argumentul lor este intervalul de celule. Pentru a calcula intervalul de variație a datelor în intervalul de celule, de exemplu, de la A1 la A100, introduceți formula: =MAX (A1:A100)-MIN (A1:A100).

Coeficientul de variație. Calculat ca procent din abaterea standard a eșantionului față de media aritmetică.

Dacă coeficientul de variație este mare (mai mult de 35%), atunci eșantionul este considerat eterogen. Prin urmare, utilizarea mediei pentru a o caracteriza este incorectă. În acest caz, se utilizează modul sau mediana.

Pentru a evalua abaterea distribuției datelor experimentale de la distribuția normală, sunt utilizate caracteristici precum asimetria DARși curtoză E.

Pentru o distribuție normală DAR=0 și E=0.

Skewness arată cât de mult este asimetrică distribuția datelor în raport cu distribuția normală: dacă DAR>0, atunci majoritatea datelor au valori peste medie; dacă DAR<0, то большая часть данных имеет значения, меньшие среднего. Асимметрия вычисляется функцией СКОС. Ее аргументом является интервал ячеек с данными, например, =СКОС (А1:А100).

Kurtosis evaluează „răcorul”, adică. valoarea unei creșteri mai mari sau mai mici a maximului distribuției datelor experimentale față de maximul distribuției normale. În cazul în care un E>0, atunci maximul distribuției experimentale este mai mare decât cel normal; dacă E<0, то максимум экспериментального распределения ниже нормального. Эксцесс вычисляется функцией ЭКСЦЕСС, аргументом которой являются числовые данные, заданные, как правило, в виде интервала ячеек, например: =ЭКСЦЕСС (А1:А100). [см. 5]

Obținem următoarele calcule (Figura 14).

Figura 14 Calculul principalelor caracteristici

Am obținut următoarele valori (Figura 15).


Figura 15 Valorile principalelor caracteristici

Deoarece valoarea coeficientului de variație depășește semnificativ 35%, eșantionul este eterogen și mediana este utilizată ca valoare medie.

Acasă > Document

Introducere. 2

Conceptul de statistică. 2

Istoria statisticii matematice. 3

Cele mai simple caracteristici statistice. 5

Cercetare statistică. opt

1. MEDIA ARITMETICĂ 92. INTERVAL 103. MODUL 104. MEDIANA 115. APLICAREA COMUNĂ A CARACTERISTICILOR STATISTICE 11

Perspective și concluzie. unsprezece

Bibliografie. 12

Introducere.

În octombrie, într-o pauză înainte de lecție, profesoara noastră de matematică Marianna Rudolfovna a verificat muncă independentă in clasa a VII-a. Văzând despre ce scriau, nu am înțeles niciun cuvânt, dar am întrebat-o pe Marianna Rudolfovna ce înseamnă cuvintele necunoscute pentru mine - interval, mod, mediană, medie. Când am primit răspunsul, nu am înțeles nimic. La sfârșitul trimestrului 2, Marianna Rudolfovna a invitat pe cineva din clasa noastră să facă un eseu tocmai pe această temă. Mi s-a părut foarte interesant acest job și am fost de acord. În cursul lucrării, au fost luate în considerare astfel de probleme
    Ce este statistica matematică? Care este sensul statisticilor pentru omul obișnuit? Unde se aplică cunoștințele dobândite? De ce nu poate o persoană să facă fără statistici matematice?

Conceptul de statistică.

STATISTICI este o știință care se ocupă cu obținerea, prelucrarea și analizarea datelor cantitative despre diverse fenomene care apar în natură și societate. În mass-media se găsesc des expresii precum statistica accidentelor, statistica populației, statistica bolilor, statistica divorțului etc.. Una dintre sarcinile principale ale statisticii este prelucrarea corectă a informațiilor. Desigur, statistica are multe alte sarcini: obținerea și stocarea informațiilor, realizarea diferitelor prognoze, evaluarea fiabilității acestora etc. Niciunul dintre aceste obiective nu poate fi atins fără prelucrarea datelor. Prin urmare, primul lucru de făcut sunt metodele statistice de prelucrare a informațiilor. Există mulți termeni folosiți în statistică pentru aceasta. STATISTICA MATEMATICĂ - o ramură a matematicii dedicată metodelor și regulilor de prelucrare și analiză a datelor statistice

Istoria statisticii matematice.

Statistica matematică ca știință începe cu lucrările celebrului matematician german Carl Friedrich Gauss (1777-1855), care, bazându-se pe teoria probabilității, a investigat și fundamentat metoda celor mai mici pătrate, pe care a creat-o în 1795 și a aplicat-o proceselor astronomice. date (pentru a clarifica orbita unei mici planete Ceres). Una dintre cele mai populare distribuții de probabilitate, cea normală, este adesea numită după el, iar în teoria proceselor aleatorii, obiectul principal de studiu îl reprezintă procesele gaussiene. LA sfârşitul XIX-leaîn. - începutul secolului al XX-lea. o contribuție majoră la statistica matematică a avut-o cercetătorii englezi, în primul rând K. Pearson (1857-1936) și R. A. Fisher (1890-1962). În special, Pearson a dezvoltat testul chi-pătrat pentru testarea ipotezelor statistice, iar Fisher a dezvoltat analiza varianței, teoria designului experimentului și metoda probabilității maxime pentru estimarea parametrilor. LA În anii 1930, polonezul Jerzy Neumann (1894-1977) și englezul E. Pearson au dezvoltat teorie generală testarea ipotezelor statistice,

și matematicienii sovietici Academicianul A.N. Kolmogorov (1903-1987) și membru corespondent al Academiei de Științe a URSS N.V. Smirnov (1900-1966) au pus bazele statisticii neparametrice.

În anii patruzeci ai secolului al XX-lea. Matematicianul român A. Wald (1902-1950) a construit teoria secvenţială analize statistice. Statistica matematică se dezvoltă rapid în prezent.

Cele mai simple caracteristici statistice.

În viața de zi cu zi, noi, fără să știm, folosim concepte precum mediana, modul, intervalul și media aritmetică. Chiar și atunci când mergem la magazin sau facem curățenia. Media aritmetică a unei serii de numere se numește câtul împărțirii sumei acestor numere la numărul lor. Media aritmetică este o caracteristică importantă a unei serii de numere, dar uneori este util să luăm în considerare altele. mediu. Modă numiți numărul rândului care apare cel mai des în acest rând. Putem spune că acest număr este cel mai „la modă” din această serie. Un indicator precum modul este utilizat nu numai pentru datele numerice. Dacă, de exemplu, un grup mare de elevi este întrebat ce materie școlară le place cel mai mult, atunci moda acestei serii de răspunsuri va fi subiectul care va fi numit cel mai des. Modul este un indicator care este utilizat pe scară largă în statistici. Una dintre cele mai comune utilizări ale modei este studierea cererii. De exemplu, atunci când se decide în ce pachete de greutate să împacheteze untul, în ce zboruri să se deschidă etc., cererea este studiată în prealabil și se identifică moda - cea mai comună comandă. Rețineți că în seriile luate în considerare în studiile statistice reale, uneori se disting mai mult de un mod. Când există multe date într-o serie, toate acele valori care apar mult mai des decât altele sunt interesante. Statisticile lor sunt numite și modă. Cu toate acestea, găsirea mediei aritmetice sau a modului nu face întotdeauna posibilă tragerea de concluzii de încredere bazate pe date statistice. Dacă există o serie de date, atunci, pe lângă valorile medii, este necesar să se indice și modul în care datele utilizate diferă unele de altele. Unul dintre indicatorii statistici ai diferenței sau împrăștierii datelor este intervalul. domeniul de aplicare este diferența dintre cel mai mare și cele mai mici valori o serie de date. O altă caracteristică statistică importantă a unei serii de date este mediana acesteia. De obicei, mediana este căutată atunci când numerele din serie sunt niște indicatori și trebuie să găsești, de exemplu, o persoană care a arătat un rezultat mediu, o companie cu un profit mediu anual, o companie aeriană care oferă prețuri medii ale biletelor etc. Median o serie formată dintr-un număr impar de numere se numește numărul acestei serii, care va fi la mijloc dacă această serie este ordonată. Mediana unei serii formată dintr-un număr par de numere este media aritmetică a celor două numere din mijlocul acestei serii. De exemplu: 1. EPT pentru clasa a IV-a se ține în fiecare an în școlile din Perm și în 2010 s-au obținut următoarele punctaje medii:
scoli Matematica Limba rusă
Gimnaziul nr 4 68,5 b. 62,4 b.
55 53.1 b 52,7 b.
111 46,9 b 51,6 b.
40 48,4 b 51,9 b.
    Mama mea lucrează la fabrica de pulbere Perm ca contabilă. Salariul angajaților acestei întreprinderi variază de la 12.000 la 18.000. diferența este de 6000. Aceasta se numește span. Acum câțiva ani, părinții mei și cu mine eram în vacanță în sudul Anapa. Am observat că numărul 23 se găsește cel mai des pe numerele de mașini - numărul regiunii. Se numește modă. Am petrecut astfel de timp pe teme în timpul săptămânii - 60 de minute luni, 103 minute marți, 58 de minute miercuri, 76 de minute joi și 89 de minute vineri. După ce au scris aceste numere de la cel mai mic la cel mai mare, numărul 76 se află în mijloc - aceasta se numește mediană.

Cercetare statistică.

« Statistica știe totul- Ilf și Petrov au declarat în celebrul lor roman „Cele douăsprezece scaune” și au continuat: „Se știe câtă mâncare mănâncă cetățeanul obișnuit al republicii pe an... Se știe câți vânători, balerine... mașini-unelte, biciclete, monumente, faruri și mașini de cusut... Câtă viață, plină de ardoare, pasiuni și gânduri, ne privește din tabele statistice!(din italiană stato - stat, latină status - stat).

1. MEDIA ARITMETICĂ

Am calculat costurile medii ale energiei electrice pentru familia noastră în 2010:
Lună 1 2 3 4 5 6 7 8 9 10 11 12
Consum, kW/h 189 155 106 102 112 138 106 112 156 149 160 155
(189 + 155*2 + 106*2 + 102 + 112*2 + 138 + 160 + 156 + 149) : 12 = 136 - medie aritmetică Când este necesară media aritmetică și când nu este necesară? Este logic să calculăm cheltuielile medii ale familiei pentru hrană, randamentul mediu de cartofi în grădină, costurile medii cu alimente pentru a înțelege ce să faci data viitoare, astfel încât să nu existe o cheltuială prea mare, nota medie pentru trimestrul - se va nota pentru trimestrul. Nu are sens să calculez salariul mediu al mamei mele și al lui Abramovici, temperatura medie a unei persoane sănătoase și bolnave, dimensiunea medie pantofi pentru mine și fratele meu.

2. ROTIRE

Înălțimea fetelor din clasa noastră este foarte diferită: 151 cm, 160 cm, 163 cm, 162 cm, 145 cm, 130 cm, 131 cm, 161 cm Spațiul este de 163 - 130 \u003d 33 cm. diferenta de inaltime. Când este necesar și când nu este necesar? Intervalul unei serii este găsit atunci când doresc să determine cât de mare este răspândirea datelor într-o serie. De exemplu, în timpul zilei, temperatura aerului din oraș a fost înregistrată în fiecare oră. Pentru seria de date obținută, este util nu numai să se calculeze media aritmetică, care arată care este temperatura medie zilnică, ci și să se găsească intervalul seriei, care caracterizează fluctuația temperaturii aerului în această zi. Pentru temperatura de pe Mercur, de exemplu, intervalul este de 350 + 150 = 500 C. Desigur, o persoană nu poate rezista la o astfel de diferență de temperatură.

3. MODA

Mi-am scris notele pentru luna decembrie la matematică: 4,5,5,4,4,4,4,5,5,4,5,5,4,5,5,5,5,5,5. S-a dovedit că am primit: "5" - 7, "4" - 5, "3" - 0, "2" - 0 Moda este 5. Dar există mai mult de o modă, de exemplu, în istoria naturală în octombrie Am avut astfel de note - 4,4,5,4,4,3,5,5,5. Există două moduri - 4 și 5 Când este nevoie de modă? Moda este importantă pentru producători în determinarea celei mai populare mărimi de îmbrăcăminte, dimensiunea pantofilor, mărimea sticlei de suc, punga de chipsuri, stilul vestimentar popular.

4. MEDIAN

La analiza rezultatelor prezentate de participanții la cursa de clasă de 100 de metri, cunoașterea medianei permite profesorului de educație fizică să selecteze un grup de copii care au prezentat un rezultat peste mediana de participare la competiție. Când este necesară mediana și când nu este necesară? Mediana este folosită mai des cu alte caracteristici statistice, dar singura poate fi folosită pentru a selecta rezultate deasupra sau sub mediană.

5. APLICAREA COMUNĂ A CARACTERISTICILOR STATISTICE

În clasa noastră pentru ultimul munca de verificare la matematică la tema „Măsurarea unghiurilor și tipurile lor” s-au obținut următoarele note: „5” - 10, „4” - 5, „3” - 7, „2” - 1. Media aritmetică - 4,3, interval - 3, mod - 5, mediană - 4.

Perspective și concluzie.

Caracteristicile statistice vă permit să studiați serie de numere. Numai împreună pot da o evaluare obiectivă a situației.Este imposibil să ne organizăm corect viața fără a cunoaște legile matematicii. Vă permite să studiați, să învățați, să corectați. Statistica creează fundamentul unor fapte exacte și incontestabile, care sunt necesare în scopuri teoretice și practice. Matematicienii au inventat statistica pentru că societatea avea nevoie de ea.Cred că cunoștințele acumulate în timpul lucrului la acest subiect îmi vor fi de folos în studiile viitoare și în viață. În timp ce studiam literatura, am învățat că există și alte caracteristici, cum ar fi abaterea standard, varianța și altele. Cu toate acestea, cunoștințele mele nu sunt suficiente pentru a le înțelege. Despre ei în viitor.

Bibliografie.

    Tutorial pentru elevii din clasele 7-9 institutii de invatamant"Algebră. Elemente de statistică și teoria probabilității. Yu.N.Makarychev, N.G.Mindyuk, editat de S.A.Telyakovsky; Moscova. Educaţie. 2005 Articole din suplimentul la ziarul „Primul septembrie. Matematica". Dicționar enciclopedic al unui tânăr matematician / /seminar/2009/projects11/rezim/stat1.html /articles/412398/
  1. Complex educațional și metodologic pentru specialități 080504 Administrația de stat și municipală 080507 Managementul organizațiilor

    Complex de instruire și metodologie
  2. Orientări 6 Științe sociale 21 00 Științe sociale în general 21 02 Filosofie 21

    Instrucțiuni

    Rubricatorul de Stat al Informațiilor Științifice și Tehnice (SRSTI Rubricator) este o clasificare ierarhică universală a domeniilor de cunoaștere adoptată pentru sistematizarea întregului flux de informații științifice și tehnice.

  3. Complex educativ-metodic statistica juridica invatamant profesional superior specialitatea 030501. 65 Jurisprudenta domeniul de studiu (licenta)

    Complex de instruire și metodologie

    Studiul științei statistice joacă un rol important în pregătirea avocaților cu înaltă calificare – atât practicieni, cât și cercetători. Specialist in domeniu Stiinte Sociale, juridic în special, trebuie să stăpânească aspectele de bază